- 创建并激活 python 虚拟环境
python -m venv .venv
source .venv/bin/activate- 安装 python 环境并安装依赖
pip install -r requirements.txt-
文件解析工具
MinerU(本仓库使用版本:2.1.0)安装说明:https://github.com/opendatalab/MinerU/blob/mineru-2.0.0-released/README_zh-CN.md -
程序运行
python -m RAG.examples.01_simple_rag本系列文章将会系统性讲解涵盖 AI 应用开发中涉及到的各种技术,包括但不限于提示工程、RAG、模型微调、Agent 等等。
欢迎大家关注我的微信公众号【燃哥讲 AI】,分享 AI 应用开发前沿技术,注重理论结合实践,助你成为 AI 浪潮中的超级个体!
- 面对汹涌的 AI 浪潮,前端开发者该如何破局?
- 前端 x AI:从了解提示工程、RAG 和微调开始
- 前端 x AI:基于 Ollama、DeepSeek、Chroma、LangChain 搭建 AI 应用开发框架
待更新,敬请期待...
- RAG 系列(一):一文让你由浅到深搞懂 RAG 实现
- RAG 系列(二):基于 DeepSeek + Chroma + LangChain 开发一个简单 RAG 系统
- RAG 系列(三):系统评估 - 构造 QA 测试数据集
- RAG 系列(四):系统评估 - 五个主流评估指标详解
- RAG 系列(五):系统评估 - 基于 LLM-as-judge 实现评估系统
- RAG 系列(六):问题优化 - 意图识别&同义改写&多视角分解&补充上下文
- RAG 系列(七):解析优化 - 不同文件类型统一转换成 Markdown
- RAG 系列(八):切分优化 - 基于 Markdown 语法的文档切分
- RAG 系列(九):解析优化 - 使用 Doc2X 将 PDF 高效转换为 Markdown
- RAG 系列(十):切分优化 - 基于句子相似距离的语义切分
- RAG 系列(十一):复杂文档解析不理想?使用 TextIn xParse 轻松解析多样性 PDF 文档
- RAG系列(十二):MinerU、Docling还是Unstructured?用OmniDocBench评测开源文档解析工具
待更新,敬请期待...
待更新,敬请期待...
