chill/chill_notes

Files

FNS Service 0555a5abfc Update from Sync Service

2026-04-28 09:32:20 +08:00

1.9 KiB

Executable File

Raw Blame History

created, type, tags

created

type

tags

2026-04-28

concept

RAG，检索增强生成，LLM，知识库

RAG（检索增强生成）

Retrieval-Augmented Generation：先检索相关知识，再生成回答

定义

RAG 是一种将外部知识库检索与 LLM 生成相结合的技术架构。它让 LLM 在回答问题前，先从特定知识库中检索相关信息，基于检索到的内容生成更准确、更少幻觉的回答。

工作流程

用户提问 → 向量化 → 检索相关知识块 → 组装 Prompt → LLM 生成回答

核心组件

组件	说明
文档分块（Chunking）	将长文档拆分为小块（通常 500-1000 tokens）
向量化（Embedding）	用 embedding 模型将文本转为向量
向量数据库	存储和检索向量（如 FAISS、Pinecone、Chroma）
检索器	根据查询向量找到最相关的知识块
LLM	基于检索到的内容生成回答

RAG 的演进

版本	特点
Naive RAG	简单检索+生成，容易遗漏上下文
Advanced RAG	增加重排序、查询扩展、多路召回
GraphRAG	引入知识图谱，支持多跳推理和全局理解
Agentic RAG	智能体自主决定何时检索、检索什么

优势与劣势

优势 ✅	劣势 ⚠️
减少幻觉	检索质量直接影响回答质量
支持实时知识更新	文档分块可能割裂上下文
可追溯来源	向量相似度≠语义相关性
降低 LLM 训练成本	无法回答知识库外的全新问题

应用场景

企业内部知识库问答
客服机器人
文档智能检索
法律/医疗专业问答

相关概念

知识图谱（GraphRAG 的基础）
神经网络（embedding 模型的基础）
Transformer 架构（LLM 和 embedding 的共同基础）

整理自知识库参考资料