资源概览
用 notebook 展示多种 RAG 技术路线,适合学习 chunk、检索、重排、查询改写和评估。
怎么开始学
四步学习路线
这份资源按下面顺序学习,能从“看过链接”推进到“能在真实任务里复用”。
先跑最小链路
选择一个 notebook 或最小示例,先完成文档切分、向量化、检索和回答。
沉淀:最小 RAG demo
对比检索质量
固定一组真实问题,分别测试 chunk 大小、metadata、重排和查询改写。
沉淀:检索对比表
加引用和评估
要求答案带来源片段,记录未命中、错引和幻觉问题。
沉淀:评估问题集
接业务工具
把验证过的设置迁移到 Dify、RAGFlow 或自建服务。
沉淀:知识库上线清单实践任务样板
知识库资源必须能落到具体任务。下面是建议用来验证这个资源是否真有用的样板。
企业运营团队想把产品手册、售后规则和历史 FAQ 做成客服知识库。
准备 20 篇真实文档、30 个历史问题、必须引用来源的要求,以及不能回答价格/退款争议的边界。
用资源里的 RAG 技术跑三组设置,比较召回片段、答案准确率、引用完整度和未命中问题。
人工核对引用是否来自原文,记录错误回答、过期政策和应该转人工的问题。
License 和使用提醒
当前标记为 NOASSERTION。学习、引用、二次整理或用于商业项目时,应优先查看原仓库 LICENSE、README、NOTICE 和维护者说明;AI旗页只做中文摘要和使用判断,不替代法律审查。
- 不要只看 Star,必须同时看更新时间、Issue、维护者和可运行示例。
- 不要整段复制 README 到站内页面,AI旗页只保留中文摘要、判断和来源链接。
- License 未明确标注时,只建议学习和引用链接,不建议直接复制内容或二次分发。
- RAG 示例不能直接等同生产效果,必须用真实问题验证召回、引用和未命中。
来源核验清单
学完以后沉淀什么
不要只收藏资源链接。把学习结果整理成可复用材料,后续才能进入工具选型、实战资料或企业方案。
最小 RAG 示例
分块和检索设置
重排或查询改写记录
评估问题集
可复用知识库方案