--- created: 2026-04-28 type: concept tags: [深度学习,神经网络,AI] --- # 深度学习(Deep Learning) > 使用多层神经网络从数据中自动学习特征表示 ## 定义 深度学习是[[机器学习]]的一个子领域,通过多层("深度")[[神经网络]]学习数据的分层表示。每一层提取不同抽象级别的特征。 ## 核心架构 | 架构 | 特点 | 应用 | |------|------|------| | **CNN(卷积网络)** | 局部感受野+权重共享 | 图像识别、CV | | **RNN/LSTM** | 序列记忆 | 时间序列、NLP(已被 Transformer 替代) | | **[[Transformer 架构]]** | 自注意力机制 | NLP、多模态 | | **GAN(生成对抗)** | 生成器 vs 判别器对抗 | 图像生成 | | **扩散模型** | 逐步去噪生成 | DALL·E、Midjourney、Stable Diffusion | ## 与[[机器学习]]的区别 | 传统机器学习 | 深度学习 | |-------------|---------| | 需要人工特征工程 | 自动学习特征 | | 适合小数据 | 需要大数据 | | 模型可解释 | 黑盒 | | 计算需求低 | 需要 GPU | ## 关键突破 - 2012:AlexNet(ImageNet 冠军,深度学习爆发) - 2017:[[Transformer 架构]](Attention Is All You Need) - 2022:扩散模型爆发(Stable Diffusion) - 2023:GPT-4(多模态) ## 相关概念 - [[神经网络]](深度学习的基础) - [[机器学习]](深度学习的父领域) - [[监督学习]] / [[无监督学习]] - [[反向传播]](训练算法) - [[Transformer 架构]] --- *基于 AI 基础知识整理*