RAG 学习

RAG Techniques

用 notebook 展示多种 RAG 技术路线,适合学习 chunk、检索、重排、查询改写和评估。

RAG Techniques 知识库资源详情图标

资源概览

用 notebook 展示多种 RAG 技术路线,适合学习 chunk、检索、重排、查询改写和评估。

NirDiamant/RAG_Techniques Star 2.7万 License NOASSERTION 更新 2026-05-15

怎么开始学

第一步先跑最基础 RAG,再逐个试 query rewrite、rerank、metadata filtering,不要一开始堆复杂链路。
第二步把资源里的示例改成自己的任务,不要只收藏链接或照抄 README。
第三步进入 AI旗页的实战资料或工具库,用真实任务验证是否能复用。

四步学习路线

这份资源按下面顺序学习,能从“看过链接”推进到“能在真实任务里复用”。

1
先跑最小链路

选择一个 notebook 或最小示例,先完成文档切分、向量化、检索和回答。

沉淀:最小 RAG demo
2
对比检索质量

固定一组真实问题,分别测试 chunk 大小、metadata、重排和查询改写。

沉淀:检索对比表
3
加引用和评估

要求答案带来源片段,记录未命中、错引和幻觉问题。

沉淀:评估问题集
4
接业务工具

把验证过的设置迁移到 Dify、RAGFlow 或自建服务。

沉淀:知识库上线清单

实践任务样板

知识库资源必须能落到具体任务。下面是建议用来验证这个资源是否真有用的样板。

真实场景

企业运营团队想把产品手册、售后规则和历史 FAQ 做成客服知识库。

输入资料

准备 20 篇真实文档、30 个历史问题、必须引用来源的要求,以及不能回答价格/退款争议的边界。

预期输出

用资源里的 RAG 技术跑三组设置,比较召回片段、答案准确率、引用完整度和未命中问题。

人工核对

人工核对引用是否来自原文,记录错误回答、过期政策和应该转人工的问题。

License 和使用提醒

当前标记为 NOASSERTION。学习、引用、二次整理或用于商业项目时,应优先查看原仓库 LICENSE、README、NOTICE 和维护者说明;AI旗页只做中文摘要和使用判断,不替代法律审查。

  • 不要只看 Star,必须同时看更新时间、Issue、维护者和可运行示例。
  • 不要整段复制 README 到站内页面,AI旗页只保留中文摘要、判断和来源链接。
  • License 未明确标注时,只建议学习和引用链接,不建议直接复制内容或二次分发。
  • RAG 示例不能直接等同生产效果,必须用真实问题验证召回、引用和未命中。

来源核验清单

来源链接https://github.com/NirDiamant/RAG_Techniques
维护状态最近标记更新:2026-05-15
LicenseNOASSERTION,使用前仍需查看原仓库 LICENSE / README / NOTICE
适合人群RAG 开发者、知识库工程师、企业内部搜索团队
先看内容先跑最基础 RAG,再逐个试 query rewrite、rerank、metadata filtering,不要一开始堆复杂链路。

学完以后沉淀什么

不要只收藏资源链接。把学习结果整理成可复用材料,后续才能进入工具选型、实战资料或企业方案。

最小 RAG 示例 分块和检索设置 重排或查询改写记录 评估问题集 可复用知识库方案