AI 学习笔记

人工智能相关知识点整理,供个人学习与复习使用。

机器学习基础

监督学习与无监督学习

监督学习:利用带标签的数据训练模型,常见任务包括分类与回归。无监督学习:无标签数据,典型如聚类、降维、异常检测等。

过拟合与正则化

过拟合指模型在训练集上表现很好、在未见数据上泛化差。常用缓解方法:增加数据、正则化(L1/L2)、早停、 dropout 等。

损失函数与优化

损失函数衡量预测与真实值的差距;优化器(如 SGD、Adam)通过梯度下降最小化损失,从而更新模型参数。

深度学习

神经网络基础

由输入层、隐藏层、输出层组成,通过线性变换与激活函数(ReLU、Sigmoid 等)实现非线性拟合,可拟合复杂函数。

卷积神经网络(CNN)

通过卷积核提取局部特征,常用于图像分类、目标检测等。典型结构:卷积层、池化层、全连接层,如 LeNet、ResNet。

循环神经网络与注意力

RNN/LSTM 处理序列数据;注意力机制让模型关注重要部分。Transformer 基于自注意力,成为大模型的基础架构。

大模型与 NLP

预训练与微调

预训练:在海量文本上学习通用表示;微调:在特定任务数据上继续训练,使模型适应下游任务(如问答、摘要)。

大语言模型(LLM)

参数量达数十亿至万亿的生成式语言模型,具备理解与生成自然语言的能力,常通过提示(Prompt)与人类对齐。

提示工程

通过设计输入提示(指令、示例、格式等)引导模型输出期望结果,是使用大模型的重要实践技能。