FuFan Chat Api

# fufan-chat-api

**Repository Path**: linfeng-zh/fufan-chat-api

## Basic Information

- **Project Name**: fufan-chat-api
- **Description**: No description available
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: main
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 1
- **Forks**: 0
- **Created**: 2024-12-09
- **Last Updated**: 2025-06-03

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

<div align="center">
  <img alt="FuFan Chat Logo" width="120" height="120" src="https://muyu001.oss-cn-beijing.aliyuncs.com/img/20240823192944.jpg">
  <h1>FuFan Chat Api</h1>
  <span>中文 | <a href="./README.md">English</a></span>
</div>


## ⚡ 项目简介

Fufan-chat-api 是一个基于大模型技术开发的本地知识库智能问答系统。本系统实现了目前大模型应用落地的五个核心场景：大模型通用领域知识问答、本地私有知识库问答、实时联网搜索问答、AI Agents 问答以及大模型推荐系统。此外，系统内置了完整的RAG评估方案和流程，同时支持Docker容器化部署，提供非常灵活和高效的应用部署方案。

  <div align="center">
  <img src="https://muyu001.oss-cn-beijing.aliyuncs.com/img/fufan-logo.jpg" width="1200"/>
  </div>

### 技术架构
本项目是在👉[LangChain-chatchat v0.2](https://github.com/chatchat-space/Langchain-Chatchat) 版本的基础上进行的二次开发，优化了原有的架构，使用了前后端分离的设计方案。后端全部使用Python开发语言，前端则采用了现代的Vue3框架。 该项目对接的前端开源仓库👉 [fufan-chat-web](https://github.com/fufankeji/fufan-chat-web) 

### 主要特点
- **主流功能覆盖**：涵盖大模型通用知识问答、本地私有知识库问答、实时联网检索问答、AI Agents问答及大模型推荐系统。
- **数据预处理**：百万级Wiki公有语料、Markdown、PDF等类型的私有语料从0到1构建和精细化处理流程。
- **用户权限管理**：实现细粒度的用户访问控制，高效保障数据安全与隐私。
- **灵活接入基座大模型**：支持接入主流的在线和开源大模型，确保系统的适应性和前瞻性。
- **数据库整合**：集成关系型数据库和向量数据库，优化数据存取效率和查询响应时间。
- **高效且完整的RAG评估系统**：内置完整的RAG评估Pipeline，为模型评估和优化提供强有力的支持。参考👉[FlashRAG](https://github.com/RUC-NLPIR/FlashRAG)
- **Docker容器化部署**：支持Docker容器化部署，简化部署流程，提升系统的可移植性和可维护性。

## 👀 系统演示

视频待上线.............

## 💧 功能亮点

### 一、用户模块
FuFan-chat-api 提供了一个完善的用户注册和登录机制，从而确保系统的安全性和用户的个性化体验。该模块的主要特点包括：
1. **用户注册**：允许新用户创建账户，注册后可通过前端登录界面进入系统。
2. **用户校验**：在前端进行初步的用户验证。非法用户将被阻止访问智能问答系统，确保系统的安全性。
3. **会话管理与知识库访问**：登录用户能够访问系统预置的会话及其个人创建的会话。同时，用户可使用自己的知识库进行问答，每位用户的数据访问被严格限定，用于保障个人数据的隐私性。

#### 核心逻辑流程：
  <div align="center">
  <img src="https://muyu001.oss-cn-beijing.aliyuncs.com/img/01_user_verify_clean.png" width="1200"/>
  </div>


### 二、模型接入
FuFan-chat-api 能够兼容多种高性能开源大模型、在线大模型API作为基座模型，该系统版本以 ChatGLM3-6b、glm-4-9b-chat 以及在线 GLM-4 API 接口为主。允许用户根据个人实际需求灵活接入其他模型，支持主流的 OpenAI GPT、Qwen2 等模型，以及 Vllm、Ollama 等接入框架。

#### 底层技术支持：
我们采用了👉 [FastChat](https://github.com/lm-sys/FastChat) 开源项目框架来部署模型，优化了对 glm4-9b-chat 模型的支持。尽管 FastChat 框架尚未兼容 glm4-9b-chat，我们已经手动修复了包括流式输出和自问自答重复循环等问题。现在，glm4-9b-chat 模型已经完全可用，并且表现稳定。具体架构图请看👉[FastChat服务启动逻辑](images/01_FastChat服务启动逻辑.png)以及[FastChat请求处理逻辑](images/02_FastChat请求处理逻辑.png)

#### 扩展性：
为了方便用户扩展或测试新模型，我们提供了详细的代码示例。通过这些示例，用户可以理解如何将新的模型集成到系统中，进一步增强系统的功能性和灵活性。

### 三、核心问答功能说明
#### 3.1 通用知识问答

FuFan-chat-api 的通用知识问答功能充分利用了大模型的原生对话能力。本功能直接以大模型作为基础，结合 LangChain 应用框架，创建了一个统一的大模型会话接口。通过实时读取 MySQL 数据库中指定用户和对话窗口的历史对话记录，赋予大模型会话记忆能力。具体架构图请看👉[通用领域知识问答逻辑图](images/03_通用领域知识问答逻辑.png)

##### 功能特点：
- **多轮对话支持**：用户可以进行连续的对话，系统将保持对话的上下文，增强对话的连贯性。
- **会话历史记忆**：通过记忆用户的历史对话，系统能够提供更加个性化和准确的回答，极大地增强用户体验。

##### 核心逻辑流程：

  <div align="center">
  <img src="https://muyu001.oss-cn-beijing.aliyuncs.com/img/02_gen_qa_clean.png" width="1200"/>
  </div>

#### 3.2 本地私有知识库问答

我们在通用知识问答流程的基础上，引入了本地知识库的加载和检索功能，利用大模型 RAG 技术提升问答质量。此功能允许大模型接入私有数据，同时有效解决大模型知识局限性的问题。具体架构图请看👉[本地RAG知识问答开发逻辑](images/04_本地RAG知识问答开发逻辑.png)

##### 技术实现：
我们采用 Faiss 数据库存储向量索引，为系统提供了高效的检索能力。系统预置了包括百万级 Wiki 公共语料和私有语料（ PDF 格式）的知识库，用于提升数据的广泛性和深度。具体架构图请看👉[向量数据库集成逻辑](images/05_向量数据库集成逻辑.png)

##### 功能特点：
  - **多轮对话支持**：允许在多个连续交互中始终保持对话的连贯性。
  - **历史记忆功能**：通过历史会话记录增强对话的个性化和相关性。
  - **系统提示角色**：增添系统提示角色以引导用户对话，提供更为人性化的交互体验。
  - **实时 Faiss 向量数据检索召回**：利用 Faiss 向量数据库进行快速高效的数据检索，优化答案的精准度。

###### 核心逻辑流程：

  <div align="center">
  <img src="https://muyu001.oss-cn-beijing.aliyuncs.com/img/03_rag_qa_clean.png" width="1200"/>
  </div>

#### 3.3 联网实时检索 + 私有知识库检索问答
此功能链路中集成了实时联网检索，这是当前在 AI 搜索中非常主流的一种大模型应用链路。我们通过更加细节的流程处理去确保信息检索的效率和准确性，即便在国内网络环境下也能表现出色。具体架构图请看👉[联网实时检索问答逻辑](images/06_联网实时检索问答逻辑.png)

##### 实现流程：

1. **基于👉[Serper API](https://serper.dev/) 的 Google Search 信息检索**：使用 Serper API 构建的搜索能力，根据用户的查询（Query）实时检索网页信息。
2. **初步重排**：系统对初步检索结果进行筛选，选择与查询最相关的 Top N 网页信息。
3. **信息索引**：对筛选后的网页内容网页主题内容的规则化提取，而后进行索引处理，并存储到 Milvus 向量数据库中，为后续的检索操作做好准备。
4. **向量检索**：在 Milvus 向量数据库中执行检索，快速找到与用户查询最相关的信息块（Chunks）。
5. **回答生成**：将检索到的信息块整合成完整的提示（Prompt），并据此生成精确的回答，满足用户的查询需求。

##### 核心逻辑流程：

  <div align="center">
  <img src="https://muyu001.oss-cn-beijing.aliyuncs.com/img/04_real_network_clean1.png" width="1200"/>
  </div>


#### 3.4 基于大模型的推荐系统
此功能创新地将大型语言模型（LLMs）融入到教育行业的推荐系统中，以提高推荐的个性化和准确性。这一系统针对教育行业的具体需求设计，具体实现包括以下几个关键步骤：

1. **特征工程**：利用 LLMs 的强大处理能力，从教育内容中抽取和优化特征。这一步骤用来提高推荐系统对教育数据的解析能力，使推荐更加精准。
2. **实时用户画像生成**：结合 LLMs 和用户的历史行为数据，动态地生成详尽的用户画像。这一画像持续更新，能够准确捕捉用户的偏好和需求变化。
3. **基于行为和画像的实时推荐**：依据用户的历史聊天记录和实时更新的用户画像，生成个性化的教育内容推荐，旨在提高用户的学习效率和满意度。

##### 技术特点：
- **深度特征理解**：通过 LLMs 的深度学习能力，系统能够更好地理解教育内容的核心特征。
- **动态用户画像**：实时更新的用户画像确保了推荐的时效性和相关性。
- **个性化推荐**：基于精细化的用户数据和行为分析，推荐系统能够提供高度个性化的内容，满足用户的具体学习需求。

##### 核心逻辑流程：

  <div align="center">
  <img src="https://muyu001.oss-cn-beijing.aliyuncs.com/img/05_recommand_clean.png" width="1200"/>
  </div>


#### 3.5 AI Agents问答

在引入 Agent 问答功能时，初期版本基于 👉[LangChain-chatchat v0.2](https://github.com/chatchat-space/Langchain-Chatchat) 进行了实测。经过测试，我们发现该版本的效果未达到预期，因此决定进行必要的优化和调整。

##### 实现和优化进程：
- **初版实现**：本系统的早期版本基本直接继承了 LangChain-chatchat v0.2 的源代码实现，以此作为Agent问答的基础。
- **功能整合**：为了提高实时性和效率，我们优化并整合了 Serper API 的实时联网工具，以增强系统的在线搜索和数据处理能力。
- **计划升级**：考虑到 LangChain-chatchat v0.3 版本在 Agent 问答效果上的显著提升，我们计划参考并采用其最新的实现方式。这将包括对现有问答链路的全面调整和优化，以提升整体性能。

##### 更新计划：
我们正在积极开发和测试新的版本，旨在提供更加流畅和智能的 Agent 问答体验。敬请期待我们最新版本代码的上线，预计将大幅提升用户的互动质量和系统的响应速度。

##### 核心逻辑流程：

  <div align="center">
  <img src="https://muyu001.oss-cn-beijing.aliyuncs.com/img/06_agent.png" width="1200"/>
  </div>

## ☔️ 修复项
- **GLM-4 API 流式输出**：针对 GLM-4 API 流式输出功能的缺陷进行了修复，增强了模型的实时交互能力。
- **LangChain Memory 异步加载**：优化了内存管理，支持异步数据处理，提升了系统的整体性能。
- **Milvus添加索引时报错问题：TypeError: 'NoneType' object is not subscriptable**
  - 官方新版本的BUG：https://github.com/langchain-ai/langchain/issues/24116
  - 解决方法：强制安装 pip install langchain-core==0.2.5, 可暂时忽略版本依赖冲突的警告，等待langchain官方修复BUG
- **LLM 推荐系统中返回的课程列表索引解析问题：Error parsing JSON for document index 1**

## 🚀 开发

### 前提条件

确保以下软件或服务已安装并配置好：

- Python (版本 3.10 或更高)
- Mysql (版本 5.7 或更高)
- Milvus (版本 2.3.7 或更高)

### 安装步骤

1. 克隆仓库并安装依赖：
    ```bash
    git clone https://github.com/fufankeji/fufan-chat-api.git
    cd fufan-chat-api
    pip install -r requirements.txt
    ```
2. 本地部署Mysql服务并启动
   - [**Ubuntu系统上安装Mysql**](/docs/01_Ubuntu系统上安装Mysql.md)
   
3. 初始化关系型数据库表
    ```bash
    python /fufan-chat-api/server/db/create_all_model.py
    ```
4. 初始化Faiss向量数据库
    ```bash
    python /fufan-chat-api/server/knowledge_base/init_vs.py
    ```
5. 本地部署milvus向量数据库并启动（如需使用）
   - [**Ubuntu系统上安装Milvus**](/docs/02_Ubuntu系统安装部署Milvus向量数据库.md) 
   
6. 启动后端服务：
    ```bash
    python startup.py
    ```
   
## 🐉 API接口示例
请求地址：http://{server_ip}:8000/docs
<div align="center">
<img src="https://muyu001.oss-cn-beijing.aliyuncs.com/img/image-20240717192132838.png" alt="image-20240713010710534" width="1000"/>
</div>

## 🔑 使用示例

使用 Postman 或其他 HTTP 客户端工具访问 API 接口：

### POST 请求示例

```http
http://192.168.110.131:8000/api/chat  # 替换为自己实际启动的服务 IP + 端口

{
    "query":"什么是机器学习",
    "conversation_id":"18b352a0-42de-419c-ada1-a0fa44dbee1d",
    "model_name":"chatglm3-6b"
}
```

## 🙈 贡献
欢迎通过GitHub提交pull request或者issues来对项目进行贡献。我们非常欢迎任何形式的贡献，包括功能改进、bug修复或是文档优化。


## 😎 技术交流
**fufan_chat_api目前上线了v1.0版本，将持续迭代更新，感兴趣的小伙伴欢迎加入技术交流群。如有其他任何问题，<span style="color:red;">扫码添加小可爱(微信：littlelion_1215)，回复“RAG”详询哦👇</span>**

<div align="center">
<img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/image-20240713010710534.png" alt="image-20240713010710534" width="200"/>
</div>

#### [课程详情页👉](https://whakv.xetslk.com/s/1lSCCD)：该项目提供详细的源码讲解，可进入课程目录详细了解。
#### [BiliBili公开课视频 @木羽Cheney👉](https://space.bilibili.com/3537113897241540?spm_id_from=333.337.0.0)：实时追踪大模型前言发展与应用。