--- created: 2026-04-28 type: concept tags: [神经网络,深度学习,AI] --- # 神经网络(Neural Network) > 受人脑神经元启发的计算模型,是现代 AI 的基础 ## 定义 神经网络是一种由多层"神经元"组成的计算模型,通过调整层与层之间的权重来学习输入到输出的映射关系。 ## 基本结构 ``` 输入层 → [隐藏层 1 → 隐藏层 2 → ...] → 输出层 ``` - **神经元(Neuron)**:接收输入 → 加权求和 → 激活函数 → 输出 - **权重(Weight)**:连接强度,训练过程中学习 - **激活函数**:引入非线性(如 ReLU、Sigmoid、GELU) ## 主要类型 | 类型 | 特点 | 应用 | |------|------|------| | **前馈网络(FFN)** | 最简单的多层网络 | 基础分类/回归 | | **卷积网络(CNN)** | 局部感受野+权重共享 | 图像识别 | | **循环网络(RNN)** | 有记忆的状态传递 | 序列处理 | | **Transformer** | 自注意力机制 | NLP、多模态 | | **图神经网络(GNN)** | 在图上操作 | 知识图谱、社交网络 | ## 训练过程 ``` 前向传播 → 计算损失 → 反向传播 → 更新权重 → 重复 ``` - **损失函数**:衡量预测与真实的差距 - **梯度下降**:沿损失减小方向更新权重 - **学习率**:控制更新步长 ## 与 AI 的关系 ``` AI(人工智能) └── ML(机器学习) └── DL(深度学习)= 多层神经网络 └── LLM(大语言模型)= 超大规模 Transformer ``` ## 相关概念 - [[Transformer 架构]](现代 LLM 的神经网络架构) - [[监督学习]] / [[无监督学习]](训练范式) - [[RAG]](基于神经网络的应用) --- *整理自 AI 基础知识*