AI 学习笔记
人工智能相关知识点整理,供个人学习与复习使用。
机器学习基础
监督学习与无监督学习
监督学习:利用带标签的数据训练模型,常见任务包括分类与回归。无监督学习:无标签数据,典型如聚类、降维、异常检测等。
过拟合与正则化
过拟合指模型在训练集上表现很好、在未见数据上泛化差。常用缓解方法:增加数据、正则化(L1/L2)、早停、 dropout 等。
损失函数与优化
损失函数衡量预测与真实值的差距;优化器(如 SGD、Adam)通过梯度下降最小化损失,从而更新模型参数。
深度学习
神经网络基础
由输入层、隐藏层、输出层组成,通过线性变换与激活函数(ReLU、Sigmoid 等)实现非线性拟合,可拟合复杂函数。
卷积神经网络(CNN)
通过卷积核提取局部特征,常用于图像分类、目标检测等。典型结构:卷积层、池化层、全连接层,如 LeNet、ResNet。
循环神经网络与注意力
RNN/LSTM 处理序列数据;注意力机制让模型关注重要部分。Transformer 基于自注意力,成为大模型的基础架构。
大模型与 NLP
预训练与微调
预训练:在海量文本上学习通用表示;微调:在特定任务数据上继续训练,使模型适应下游任务(如问答、摘要)。
大语言模型(LLM)
参数量达数十亿至万亿的生成式语言模型,具备理解与生成自然语言的能力,常通过提示(Prompt)与人类对齐。
提示工程
通过设计输入提示(指令、示例、格式等)引导模型输出期望结果,是使用大模型的重要实践技能。