最初是一个纯粹的技术演示——用 FastAPI + LangChain + ChromaDB 搭建了一套完整的 RAG 对话链路:文档上传 → 切片 → 向量化 → 检索 → LLM 生成。功能简单但技术栈完整,适合作为 RAG 入门的参考实现。
转型的契机: 这个版本虽然能跑通 RAG 全流程,但解决的需求太泛——"基于文档问答",没有固定的使用场景。所以无法写进简历,无法作为求职项目,缺乏"解决具体痛点"的说服力。
在 RAG 实践中发现一个更普遍的痛点——笔记写了从不回看,知识散落成孤岛。于是围绕这个场景,在 RAG 引擎之上做了几件事:
- 笔记管理:Markdown 编辑器、LLM 自动标签分类、语义搜索
- 间隔重复回顾:艾宾浩斯遗忘曲线,到点提醒回顾,对抗遗忘
- AI 写作辅助:联机补全、续写扩写、跨源关联推荐
- Agent 工具集成:对话中直接搜索笔记、创建笔记、查看回顾
- 智能问答:RAG同时检索笔记库和知识库,做完笔记就可以直接同步到笔记库,越用越聪明
RAG 始终是核心引擎。 无论是笔记语义搜索、关联推荐还是对话检索,底层都是同一套向量检索链路。
考虑有学习基础RAG的需要,我们将阶段一的代码永久保留为 base-rag 分支,与 master 独立演进,保持最小可运行状态。需要纯 RAG 服务或学习 RAG 技术的同学,切换过去即可。后续base-rag也会继续维护
RAG NoteBook 的目标是成为真正能用的个人知识管理工具,而不仅仅是又一个 AI demo。后续也会继续维护master和base-rag分支。如有问题或建议,欢迎在Issues里提问。