Skip to content

Releases: RMA-MUN/LangChain-RAG-FastAPI-Service

v1.4.0

16 May 05:01

Choose a tag to compare

LangChain-RAG-FastAPI-Service v1.4.0

发布日期:2026-05-16

✨ 新增特性

  • SSE 实时推送 RAG 思考过程 — Agent 推理中间步骤通过 ContextVar + asyncio.create_task + 队列实时推送到前端,支持流式展示思考链
  • 前端思考过程面板 — 用户界面新增思考过程可视化组件,可实时查看 RAG 各阶段状态
  • 重排序重构为两阶段 — 拆分为计算前/后两个阶段,返回详细打分字段,便于前端展示排序依据
  • 统一 SSE 事件模型 — 新增 SSEEvent dataclass + to_sse() 方法,统一事件序列化
  • 测试用户登录 — 登录接口对测试用户特殊处理,返回正确 token 及虚假个人信息,不写入数据库,方便演示
  • PDF 解析引擎升级 — 使用 LangChain UnstructuredPDFLoader 替换 PyPDFLoader,提升复杂 PDF 解析兼容性
  • "关于我们"页面优化 — 优化展示效果,支持一键跳转项目 GitHub

🏗️ 架构调整

  • 向量库上传流程重构handle_add_vector_multiple_stream 拆分为 9 个 SSE 辅助方法 + 3 个阶段方法,主函数从 275 行压缩至 44 行,消除 8 处重复 yield
  • MD5 操作抽取 — 将 MD5 文件操作从 VectorStoreService 转移到 MD5Store 类,消除 5 处重复文件操作代码
  • 清理废弃模型 — 移除已被 SSEEvent 替代的 UploadProgress Pydantic 模型和 SliceResult 类,减少技术债务

🐛 问题修复

  • 修复 Vite proxy 误匹配导致刷新 /knowledgebase 路由时出现 404 的问题

📦 新增依赖

  • 导出 requirements.txt(从 pyproject.toml 生成),方便习惯使用 pip 的用户安装依赖

📚 文档

  • 新增知识库前端界面展示截图
  • 增加 Django ORM 迁移指令
  • 修复文档中错误的路由

欢迎提交 Issue & PR 参与项目共建

v1.3.0

10 May 07:27
3805ba8

Choose a tag to compare

LangChain-RAG-FastAPI-Service v1.3.0

✨ 新增特性

  • 精细化向量数据库数据管理,新增文档原始名称、切片数量、切片详情等字段存储,适配前端可视化展示需求
  • 新增向量数据库完整CRUD接口,支持前端可视化直接修改向量库内容
  • 多文档上传向量库对接 SSE 实现实时进度推送;针对 Chroma(SQLite) 不支持并发写入问题,采用「线程池并发切分文档 + 单线程串行入库」方案,最大化上传效率
  • 新增「关于我们」页面,前端可一键跳转项目 GitHub,方便用户反馈问题、提交建议
  • 支持 Ollama + 阿里云百炼 双平台 LLM / Embedding 模型,通过修改 .env 配置文件即可快速切换模型

🏗️ 架构调整

  • 拆分 vector_store 模块:对外接口保持不变,底层逻辑拆分为独立类,解决原文件近900行过于臃肿、难以维护的问题
  • 重构路由分层:将原RAG对话、向量库管理接口拆分,新增 knowledge_routerknowledge_service,分离路由与业务逻辑,优化项目结构

🐛 问题修复

  • 修复 Unrecognized model, should have a model_type key in its config.json. 报错
    新增 config.json 自动查找函数,解决模型目录不匹配、自动下载后路径异常导致的模型识别失败问题

📦 新增依赖

  • FastAPI 端新增 rank_bm25 依赖,解决使用 user_id 隔离用户知识库时,BM25检索器底层依赖缺失问题

发布日期:2026-05-10 | 欢迎提交 Issue & PR 参与项目共建

v1.2.0

30 Apr 11:57

Choose a tag to compare

LangChain-RAG-FastAPI-Service v1.2.0

✨ 新增特性

  • 支持基于SSE + yield生成器的流式对话输出
  • 新增LangSmith全链路监控与调用追踪能力
  • 扩展支持pdf、txt、markdown、ppt、docs多格式文档上传至向量数据库

⚡ 核心优化

  • 文档上传至向量数据库时,使用余弦相似度进行语义切割,避免检索时出现语义不完整的情况
  • RAG全链路升级:HYDE语义前置优化 + BM25+向量检索动态权重融合 + Cross Encoder重排序
  • 多文档批量处理 (多文档上传至向量数据库、多文档总结) 新增线程池并发支持,大幅降低任务耗时
  • 重排序模型禁用梯度运算,显著提升推理性能

🐛 问题修复

  • 修复asyncio is not defined运行时异常,提升服务稳定性

发布日期:2026-04-30 | 欢迎提交Issue & PR参与项目共建

v1.1.0

30 Mar 13:48

Choose a tag to compare

LangChain-RAG-FastAPI-Service v1.1.0

📝 更新内容

  • 优化RAG检索召回内容质量
  • 升级前端交互体验
  • 新增BM25关键词检索 + 余弦相似度(Cosine Similarity) 融合算法,实现高精度RAG检索
  • 集成Hugging Face Qwen3-reranker:0.6b重排序模型,结合sentence-transformers实现Cross Encoder检索结果重排
  • 优化用户注册及个人信息修改交互流程

🐛 问题修复

  • 修复模型回复过程中出现无限循环检索的异常问题
  • 修复模型生成回复内容被异常截断的问题
  • 修复服务端用户注册功能异常问题
  • 修复用户个人信息无法修改的功能缺陷

🤝 贡献指南

欢迎提交 Issue 与 Pull Request 参与项目共建!


发布日期:2026-03-30

v1.0.0

24 Mar 13:19

Choose a tag to compare

LangChain-RAG-FastAPI-Service v1.0.0

🚀 发布概述

正式发布企业级智能对话系统 v1.0.0 版本!这是一个基于 RAG(检索增强生成)技术构建的智能问答服务,支持文档上传、智能检索和精准回答。

✨ 核心功能

  • 智能问答 - 基于 RAG 技术,结合文档检索和大语言模型,提供精准的问答体验
  • 会话持久化 - 使用 MySQL 存储会话历史,支持长期保存和回溯
  • 文档管理 - 支持 TXT 和 PDF 文件上传、解析和智能检索
  • 多语言支持 - 集成 i18n,支持中英文界面切换
  • 微服务架构 - 分离的用户服务和对话服务,易于扩展和维护

🛠️ 技术特性

  • 高性能异步 API - 基于 FastAPI 框架,提供毫秒级响应速度
  • 流式响应 - 使用 SSE 技术实现 AI 回答的实时流式输出
  • 向量数据库 - 集成 ChromaDB,实现高效的文档检索
  • JWT 认证 - 安全的用户身份验证机制
  • 现代化前端 - Vue 3 + Vite,支持移动端友好界面

📋 系统架构

  • 后端 - FastAPI + LangChain + ChromaDB + MySQL + Redis
  • 前端 - Vue 3 + Vite + Pinia + Vue Router
  • 用户服务 - Django + JWT

🚀 快速开始

📖 文档

🔧 环境要求

  • Python 3.12+
  • Node.js 16+
  • MySQL 8.0+
  • Redis 6.0+

📝 更新内容

  • ✨ 集成 RAG 核心功能,支持文档检索和智能问答
  • 📱 完成 Vue 3 前端开发,支持移动端访问
  • 🔐 实现 JWT 用户认证和权限控制
  • 💾 会话持久化存储,支持历史记录回溯
  • 🌐 多语言支持,中英文界面切换
  • ⚡ 优化系统性能,提升响应速度
  • 🛡️ 完善的错误处理和日志系统

🔮 未来规划

  • 📚 支持更多文档格式(Word、Excel 等)
  • 🎨 优化 UI/UX 设计,提升用户体验
  • 🤖 集成更多大语言模型,提供多样化服务
  • 📊 添加数据分析和统计功能
  • 🔧 增强系统可配置性,支持更多自定义选项

🤝 贡献

欢迎提交 Issue 和 Pull Request!


发布日期: 2026-03-24
项目地址: https://github.com/RMA-MUN/LangChain-RAG-FastAPI-Service

RAG and FastAPI ChatService

12 Mar 11:45

Choose a tag to compare

Pre-release

🎉 LangChain-RAG-FastAPI-Service v0.1.0 (Pre-release)

这是项目的首个早期预览版本,核心能力已完成基础落地,RAG 检索增强生成、Agent 智能体工具调用、JWT 统一用户认证体系均已可正常跑通;当前前端交互界面与部分 API 细节仍在持续优化调整中, 欢迎大家提供建议和反馈。


✨ 本版本已实现的核心功能

  • 🏗️ 微服务架构雏形:Django 用户管理服务与 FastAPI RAG/Agent 核心服务解耦拆分,双服务独立数据库部署
  • 🤖 Agent 智能体能力:基于 LangChain 实现智能体工具调用,支持灵活扩展多场景自动化处理能力
  • 📚 基础 RAG 检索能力:集成 LangChain + ChromaDB 向量数据库,支持 TXT/PDF 文档上传解析,可基于专属文档内容完成精准智能问答
  • 💬 智能对话与持久化记忆:完整支持上下文多轮对话,会话历史通过 MySQL 实现长期持久化存储与回溯
  • 🔐 JWT 统一身份认证:配套完整的用户注册、登录体系,基于 JWT 实现无状态接口权限校验,保障接口访问安全
  • 💚 Vue 3 前端交互界面:轻量化对话交互界面已完成基础搭建,界面体验与功能细节仍在优化完善中

💡 欢迎交流反馈

如果您在使用过程中遇到 Bug、有功能建议,或是想参与项目,欢迎随时提交 Issue:
GitHub Issues 入口

感谢您的关注与支持,项目会持续迭代优化,不断完善能力与体验!