Update from Sync Service

2026-04-28 09:32:20 +08:00
parent 9e9194c263
commit 0555a5abfc
2 changed files with 132 additions and 0 deletions
--- a/wiki/Resources/方法论/RAG.md
+++ b/wiki/Resources/方法论/RAG.md
@@ -0,0 +1,64 @@
+---
+created: 2026-04-28
+type: concept
+tags: [RAG，检索增强生成，LLM，知识库]
+---
+
+# RAG（检索增强生成）
+
+> Retrieval-Augmented Generation：先检索相关知识，再生成回答
+
+## 定义
+
+RAG 是一种将外部知识库检索与 LLM 生成相结合的技术架构。它让 LLM 在回答问题前，先从特定知识库中检索相关信息，基于检索到的内容生成更准确、更少幻觉的回答。
+
+## 工作流程
+
+```
+用户提问 → 向量化 → 检索相关知识块 → 组装 Prompt → LLM 生成回答
+```
+
+## 核心组件
+
+| 组件 | 说明 |
+|------|------|
+| 文档分块（Chunking） | 将长文档拆分为小块（通常 500-1000 tokens） |
+| 向量化（Embedding） | 用 embedding 模型将文本转为向量 |
+| 向量数据库 | 存储和检索向量（如 FAISS、Pinecone、Chroma） |
+| 检索器 | 根据查询向量找到最相关的知识块 |
+| LLM | 基于检索到的内容生成回答 |
+
+## RAG 的演进
+
+| 版本 | 特点 |
+|------|------|
+| Naive RAG | 简单检索+生成，容易遗漏上下文 |
+| Advanced RAG | 增加重排序、查询扩展、多路召回 |
+| **GraphRAG** | 引入知识图谱，支持多跳推理和全局理解 |
+| Agentic RAG | 智能体自主决定何时检索、检索什么 |
+
+## 优势与劣势
+
+| 优势 ✅ | 劣势 ⚠️ |
+|---------|---------|
+| 减少幻觉 | 检索质量直接影响回答质量 |
+| 支持实时知识更新 | 文档分块可能割裂上下文 |
+| 可追溯来源 | 向量相似度≠语义相关性 |
+| 降低 LLM 训练成本 | 无法回答知识库外的全新问题 |
+
+## 应用场景
+
+- 企业内部知识库问答
+- 客服机器人
+- 文档智能检索
+- 法律/医疗专业问答
+
+## 相关概念
+
+- [[知识图谱]]（GraphRAG 的基础）
+- [[神经网络]]（embedding 模型的基础）
+- [[Transformer 架构]]（LLM 和 embedding 的共同基础）
+
+---
+
+*整理自知识库参考资料*