Skip to content
Merged
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
20 changes: 9 additions & 11 deletions app/docs/CommunityShare/RAG/rag.mdx
Original file line number Diff line number Diff line change
Expand Up @@ -6,18 +6,16 @@ tags:
- tag-one
---

# RAG Retrieval-Augmented Generation 增强索引生成

- 本rag笔记合适给不了解rag的人在10分钟内快速弄明白rag的流程
- 也可以参照 “马克的技术笔记” 配合食用
<br>
# RAG

- 解决的问题:智能问答,构建外部知识库,使大模型更具特化。
- 需要的工具:大模型,外部知识库,特定文件数据。
- rag 技术的本质就是(1)搜索特定文件里面的相关信息,然后(2)把这些搜索出来的信息作为补充信息或者上下文信息,然后(3)和用户的提问一起发送给大语言模型并获取答案。

# RAG流程
- 分片 -> embedding化 -> 存储到向量数据库 -> 用户提问 -> 召回 -> 重排 -> 处理后的数据与用户提问一起打包扔给大语言模型 -> 大语言模型返回答案
# 本rag toy demo 合适给不了解rag的人在10分钟内快速弄明白rag的流程
### 也可以参照 “马克的技术笔记” 配合食用
# RAG Retrieval-Augmented Generation 增强索引生成
### 解决的问题:智能问答,构建外部知识库,使大模型更具特化。
### 需要的工具:大模型,外部知识库,特定文件数据。
### rag 技术的本质就是(1)搜索特定文件里面的相关信息,然后(2)把这些搜索出来的信息作为补充信息或者上下文信息,然后(3)和用户的提问一起发送给大语言模型并获取答案。
# RAG流程:
### 分片-embedding化-存储到向量数据库-用户提问-召回-重排-处理后的数据与用户提问一起打包扔给大语言模型-大语言模型返回答案
## 一.建立自己的小rag
### 1.chunking(分片)
- 把我们的文档切分成特定片段。
Expand Down