Files
chill_notes/wiki/Resources/方法论/神经网络.md
2026-04-28 09:32:34 +08:00

62 lines
1.7 KiB
Markdown
Executable File
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
---
created: 2026-04-28
type: concept
tags: [神经网络深度学习AI]
---
# 神经网络Neural Network
> 受人脑神经元启发的计算模型,是现代 AI 的基础
## 定义
神经网络是一种由多层"神经元"组成的计算模型,通过调整层与层之间的权重来学习输入到输出的映射关系。
## 基本结构
```
输入层 → [隐藏层 1 → 隐藏层 2 → ...] → 输出层
```
- **神经元Neuron**:接收输入 → 加权求和 → 激活函数 → 输出
- **权重Weight**:连接强度,训练过程中学习
- **激活函数**:引入非线性(如 ReLU、Sigmoid、GELU
## 主要类型
| 类型 | 特点 | 应用 |
|------|------|------|
| **前馈网络FFN** | 最简单的多层网络 | 基础分类/回归 |
| **卷积网络CNN** | 局部感受野+权重共享 | 图像识别 |
| **循环网络RNN** | 有记忆的状态传递 | 序列处理 |
| **Transformer** | 自注意力机制 | NLP、多模态 |
| **图神经网络GNN** | 在图上操作 | 知识图谱、社交网络 |
## 训练过程
```
前向传播 → 计算损失 → 反向传播 → 更新权重 → 重复
```
- **损失函数**:衡量预测与真实的差距
- **梯度下降**:沿损失减小方向更新权重
- **学习率**:控制更新步长
## 与 AI 的关系
```
AI人工智能
└── ML机器学习
└── DL深度学习= 多层神经网络
└── LLM大语言模型= 超大规模 Transformer
```
## 相关概念
- [[Transformer 架构]](现代 LLM 的神经网络架构)
- [[监督学习]] / [[无监督学习]](训练范式)
- [[RAG]](基于神经网络的应用)
---
*整理自 AI 基础知识*