学习内容 - AI 知识点

机器学习基础

监督学习：利用带标签的数据训练模型，常见任务包括分类与回归。无监督学习：无标签数据，典型如聚类、降维、异常检测等。

过拟合指模型在训练集上表现很好、在未见数据上泛化差。常用缓解方法：增加数据、正则化（L1/L2）、早停、 dropout 等。

损失函数衡量预测与真实值的差距；优化器（如 SGD、Adam）通过梯度下降最小化损失，从而更新模型参数。

由输入层、隐藏层、输出层组成，通过线性变换与激活函数（ReLU、Sigmoid 等）实现非线性拟合，可拟合复杂函数。

通过卷积核提取局部特征，常用于图像分类、目标检测等。典型结构：卷积层、池化层、全连接层，如 LeNet、ResNet。

RNN/LSTM 处理序列数据；注意力机制让模型关注重要部分。Transformer 基于自注意力，成为大模型的基础架构。

预训练：在海量文本上学习通用表示；微调：在特定任务数据上继续训练，使模型适应下游任务（如问答、摘要）。

参数量达数十亿至万亿的生成式语言模型，具备理解与生成自然语言的能力，常通过提示（Prompt）与人类对齐。

通过设计输入提示（指令、示例、格式等）引导模型输出期望结果，是使用大模型的重要实践技能。