一个单页版的 RAG 技术发展树。
重点不只是“RAG 按时间怎么演化”,而是回答 3 个问题:有哪些分支、它们各自在解决什么问题、系统能否自动选择合适路线。
RAGMap 不再只讲一条线性的演进链:
- 不是只看向量检索
- 不是只看图谱检索
- 也不是把所有增强方法都塞进一个笼统的 “advanced RAG”
现在这个项目更适合被理解为:
一个用于理解 RAG 设计空间的中文技术地图。
它把 RAG 看成一棵会继续分叉的技术树,而不是单一答案。
我现在对这个项目的主张是:
RAG 的未来不是“所有任务都用同一种检索”,而是针对问题类型、知识结构、推理深度和成本约束,动态选择不同路线。
所以 RAGMap 的重点也应该升级成两层:
- 先看不同技术枝条分别是什么
- 再看系统能不能自动决定走哪一条枝条
RAGMap
├── 向量检索分支
│ └── 解决:局部相关片段召回、低成本落地、标准知识库问答
├── 图检索分支
│ └── 解决:关系建模、社区摘要、全局主题理解、多跳结构查询
├── Memory / Agentic RAG 分支
│ └── 解决:长期记忆、任务分解、迭代检索、检索-推理协同
└── Auto Routing / Auto Selection 分支
└── 解决:面对不同问题,自动选择 vector / graph / agentic 路径
这意味着 RAGMap 不只是论文导航,也可以自然演化成一个系统设计框架:
- 用什么知识组织
- 用什么检索路径
- 用不用 agent
- 什么时候自动切换模式
你更关心:
- 什么是基础 RAG
- 为什么只做向量检索很快就不够
- 图检索、agentic RAG、auto routing 到底差在哪
你更关心:
- 不同分支的核心问题意识是什么
- 这些方法是互斥关系,还是可以组合
- auto 模式到底应该依据什么做选择
单线时间轴的问题在于它容易让人误解成:
- 新方法一定全面替代旧方法
- 图一定比向量高级
- agentic 一定比普通 RAG 更好
这不对。
更真实的情况是:
Vector RAG仍然是很多业务的最优解Graph RAG适合结构关系明显的问题Agentic RAG更适合复杂、多步、开放式任务Auto Routing适合面对混合型问题时做动态调度
所以 RAGMap 更适合画成技术树,而不是胜者通吃的时间线。
最常见的基础流程仍然是:
文档 -> chunking -> embedding -> retrieval -> reranking -> generation
它解决的是:
- 从外部知识里快速找到局部相关内容
- 以较低工程复杂度完成知识增强
- 适配 FAQ、文档问答、企业知识库等高频场景
它的优点:
- 工程成熟
- 部署简单
- 响应快
- 成本可控
它的典型短板:
- 结构关系感知弱
- 多跳推理弱
- 全局主题整合弱
- chunk 化之后容易丢上下文结构
所以它不是过时了,而是成为所有后续分支的基座。
当问题不只是“找相关文本”,而是“理解实体、关系、社区、全局主题”时,图分支就开始成立。
这条分支的代表思路包括:
GraphRAGLightRAG
它重点解决:
- 关系建模
- 社区级摘要
- 全局视角下的主题理解
- 多跳结构路径查询
它的价值不是简单替换向量,而是给系统增加一种新的知识组织方式。
它的典型代价:
- 构图成本高
- 更新难
- 工程链路更重
- 在线维护复杂
所以图检索不是默认方案,而是结构问题的强力分支。
这条分支的核心不是“再加一个 agent 壳子”,而是把 RAG 从一次性检索改造成任务驱动的检索流程。
这条分支通常会做这些事:
- 判断问题类型
- 拆解子问题
- 多轮检索
- 选择工具
- 动态修正检索路径
- 在推理过程中继续找证据
这条线上和它相邻的代表方法包括:
Think-on-RAGThink-on-Graph 2.0- 更广义的
reasoning-oriented RAG
它更适合:
- 多步问题
- 开放式复杂任务
- 需要计划和中间决策的问答
- 一次 top-k 不足以解决的问题
它的代价也很明确:
- 时延更高
- 控制更复杂
- 系统稳定性更难保证
- 很依赖任务编排质量
这是你这次提出的最重要扩展方向。
RAGMap 不应该只展示不同方法,还应该展示一个更强的未来命题:
系统是否可以先理解问题,再自动决定该走哪种 RAG 路线。
这个分支的核心不是新的单一检索算法,而是一个路由层。
它可以根据这些信号做选择:
- 问题是否偏事实查找
- 问题是否依赖实体关系
- 问题是否需要多跳推理
- 问题是否需要任务分解
- 问题是否需要长期记忆或会话状态
- 当前延迟预算和成本预算是多少
然后自动决定:
- 走
vector-first - 走
graph-first - 走
agentic - 先粗检索再升级
- 多路召回后再融合
这条分支本质上让 RAG 从“固定流水线”变成“可调度系统”。
Query
-> Query Understanding
-> Task / Complexity / Structure Estimation
-> Router
-> Vector Path
-> Graph Path
-> Agentic Path
-> Hybrid Path
-> Evidence Fusion
-> Reasoning / Generation
这也是为什么这个项目值得继续做。
因为很多资料只在介绍某一篇论文,而 RAGMap 可以专门回答:
- 这些方法之间是什么关系
- 哪些是并列分支,哪些是增强模块
- 哪些应该被系统自动选择,而不是人工拍脑袋决定
| 分支 | 核心目标 | 典型机制 | 适合任务 | 主要代价 |
|---|---|---|---|---|
| 向量检索 | 快速召回相关内容 | embedding + retrieval + rerank | FAQ、企业知识库、标准 QA | 结构弱、多跳弱 |
| 图检索 | 强化关系与全局组织 | graph construction + community summary | 多文档综合、关系问答、主题级问题 | 构图与维护成本高 |
| Agentic RAG | 让检索服务于任务分解与推理 | planning + iterative retrieval + tool use | 复杂任务、多步推理、开放式问题 | 时延高、控制复杂 |
| Auto Routing | 自动选路而不是固定流水线 | query classification + routing + fallback | 混合问题、动态场景、可扩展系统 | 设计与评估更复杂 |
- 基础 RAG:作为所有增强路线的共同起点
GraphRAG- 论文:From Local to Global: A Graph RAG Approach to Query-Focused Summarization
- arXiv: 2404.16130
LightRAG- 论文:LightRAG: Simple and Fast Retrieval-Augmented Generation
- arXiv: 2410.05779
HippoRAG- 论文:HippoRAG: Neurobiologically Inspired Long-Term Memory for Large Language Models
- arXiv: 2405.14831
HippoRAG 2- 论文:From RAG to Memory: Non-Parametric Continual Learning for Large Language Models
- arXiv: 2502.14802
Think-on-Graph 2.0- 论文:Think-on-Graph 2.0: Deep and Faithful Large Language Model Reasoning with Knowledge-guided Retrieval Augmented Generation
- arXiv: 2407.10805
ComoRAG- 论文:ComoRAG: A Cognitive-Inspired Memory-Organized RAG for Stateful Long Narrative Reasoning
- arXiv: 2508.10419
CogitoRAG- 论文:Understand Then Memory: A Cognitive Gist-Driven RAG Framework with Global Semantic Diffusion
- arXiv: 2602.15895
如果你现在再读这个仓库,建议按这个顺序理解:
- 先理解基础向量 RAG 为什么仍然重要
- 再看为什么有些问题必须引入图结构
- 然后看记忆型和 agentic 方法为什么要把检索流程动态化
- 最后看 auto routing 为什么可能成为下一阶段真正实用的系统方向
RAG 的下一步不是单点替代,而是分支并存、能力组合,以及自动选路。
也就是说,未来比拼的不只是:
- 谁的召回率更高
而是:
- 谁更会组织知识
- 谁更会选择检索路线
- 谁能把 retrieval、memory、reasoning、planning 连接起来
如果继续更新,我建议按这个方向扩:
- 把
README继续打磨成一张真正能直接讲清技术树的首页 - 把
assets/rag-evolution-map.svg升级成更正式的技术发展树图 - 单独补一个
docs/auto-routing.md,专门写 query router / strategy selector / hybrid RAG - 后续如果需要,再把每个分支拆成独立文档
当前采用 CC BY 4.0。
适合这个项目的原因很简单:
- 这是文档型知识仓库
- 允许转载、整理、再创作
- 只要求保留署名