# FlexKV **Repository Path**: OpenCloudOS/FlexKV ## Basic Information - **Project Name**: FlexKV - **Description**: FlexKV是腾讯云TACO团队和社区合作开发推出的面向超大规模 LLM 推理场景的分布式 KV Store 与多级缓存管理系统,利用多级缓存支撑推理引擎以获取更大吞吐及更低延迟。 - **Primary Language**: Unknown - **License**: Apache-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1 - **Created**: 2025-12-05 - **Last Updated**: 2025-12-05 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # FlexKV: 面向高性能分布式推理的KVCache Manager **English Version**: [README.md](README.md) FlexKV是腾讯云TACO团队和社区合作开发推出的面向超大规模 LLM 推理场景的分布式 KV Store 与多级缓存管理系统,利用多级缓存支撑推理引擎以获取更大吞吐及更低延迟。 FlexKV 采用 **Apache-2.0 开源协议**,详细信息请参见 [LICENSE](LICENSE) 文件。 ## 最新版本主要变更 ### 功能 通用功能: - 添加本地 get/put 的操作级回调 [#13](https://github.com/taco-project/FlexKV/pull/13) - 添加分布式 KV Cache 共享支持,支持 CPU 和 SSD 之间的 KV Cache 共享,以及 PCFS 的分布式共享 ([#17](https://github.com/taco-project/FlexKV/pull/17)) - 添加 GDS (GPU Direct Storage) 支持 ([#25](https://github.com/taco-project/FlexKV/pull/25)) - TP16 支持 ([#26](https://github.com/taco-project/FlexKV/pull/26)) - 支持更多 kv cache 布局。现在包括:vLLM、SGLang、TensorRT-LM ([#27](https://github.com/taco-project/FlexKV/pull/27)) - GDS 重构和 gtensor 支持 ([#42](https://github.com/taco-project/FlexKV/pull/42)) - 支持直接从 CUDA IPC Handle 构造 TensorSharedHandle ([#44](https://github.com/taco-project/FlexKV/pull/44)) 针对 vLLM: - 在 vLLM 集成中支持 dp > 1 ([#18](https://github.com/taco-project/FlexKV/pull/18)) - 添加 vLLM 适配的启动脚本 ([#47](https://github.com/taco-project/FlexKV/pull/47)) - 支持 vLLM+FlexKV 的 TP16 ([#59](https://github.com/taco-project/FlexKV/pull/59)) 针对 TensorRT-LLM - 在 TensorRT-LLM 上支持使用 FlexKV ([#48](https://github.com/taco-project/FlexKV/pull/48)) - 支持 TensorRT-LLM+FlexKV 的 TP16 ([#53](https://github.com/taco-project/FlexKV/pull/53)) ### 优化 - MLA d2h 传输优化 ([#19](https://github.com/taco-project/FlexKV/pull/19)) - 优化 SSD I/O ([#33](https://github.com/taco-project/FlexKV/pull/33)) - 增强缓存淘汰机制,引入频率感知的宽限时间 ([#38](https://github.com/taco-project/FlexKV/pull/38)) - 在 RadixTree 中使用 std::unordered_map 替代 std::map ([#41](https://github.com/taco-project/FlexKV/pull/41)) 更多详细信息,请参阅 [CHANGELOG](CHANGELOG.md) ## 如何使用 ### 安装依赖 ```bash dnf install xxhash-devel liburing-devel cmake ``` ### 编译 FlexKV ```bash ./build.sh #./build.sh --release for cython package ``` ### 在 vLLM 中使用 FlexKV 见[docs/vllm_adapter/README_zh.md](docs/vllm_adapter/README_zh.md) ### 在 TensorRT-LLM 中使用 Flexkv 见[docs/trtllm_adaption/README_zh.md](docs/trtllm_adaption/README_zh.md) ### FlexKV和Dynamo框架的集成 见[docs/dynamo_integration/README_zh.md](docs/dynamo_integration/README_zh.md) ## 设计框架