# Python后端提供大模型GraphRAG对话

**Repository Path**: zhang-jing151/GraphRAG

## Basic Information

- **Project Name**: Python后端提供大模型GraphRAG对话
- **Description**: 运用自然语言处理模型“zh_core_web_lg”将docx文档的文本处理成主谓宾三元组，再根据这个三元组构建知识图谱，将知识图谱和原文向量化后存储到"chromadb"数据库里；然后在模型推理时把用户提问拿到向量数据库里匹配相似度高的段落，再重构知识图谱得到context,将context与用户query一起输入给语言模型，实测qwen-8B效果较qwen-0.5B-instruct明显改善。
- **Primary Language**: Python
- **License**: MIT
- **Default Branch**: normalRAG
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 1
- **Created**: 2025-09-27
- **Last Updated**: 2025-09-27

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# Python后端提供大模型GraphRAG对话

#### 介绍
将文本按照一定大小切分成块后存储在数据库中，用户提问时匹配相似度靠前的段落，将提取的段落送给模型回答问题。

#### 软件架构
软件架构说明


#### 安装教程

1.  执行“git clone https://gitee.com/zhu-zhilinzhenshuai/GraphRAG.git”  
2.  执行"pip install -r reauirements.txt"  


#### 使用说明

1.  在处理docx文档的脚本里面更换你自己的docx脚本路径  
2.  首先执行处理docx文档的脚本，处理好后会自动保存知识图谱和向量数据库  
3.  在命令行输入“Uvicorn main:app --reload”来启动后端

#### 参与贡献

1.  Fork 本仓库
2.  新建 Feat_xxx 分支
3.  提交代码
4.  新建 Pull Request


#### 特技

1.  使用 Readme\_XXX.md 来支持不同的语言，例如 Readme\_en.md, Readme\_zh.md
2.  Gitee 官方博客 [blog.gitee.com](https://blog.gitee.com)
3.  你可以 [https://gitee.com/explore](https://gitee.com/explore) 这个地址来了解 Gitee 上的优秀开源项目
4.  [GVP](https://gitee.com/gvp) 全称是 Gitee 最有价值开源项目，是综合评定出的优秀开源项目
5.  Gitee 官方提供的使用手册 [https://gitee.com/help](https://gitee.com/help)
6.  Gitee 封面人物是一档用来展示 Gitee 会员风采的栏目 [https://gitee.com/gitee-stars/](https://gitee.com/gitee-stars/)