# factorflow **Repository Path**: yexf/factorflow ## Basic Information - **Project Name**: factorflow - **Description**: 专注于量化研究,包括规则、多因子研究、组合等,使用 dolphinDB 和多个数据源结合的方式进行开发回测。 - **Primary Language**: Python - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1 - **Created**: 2025-09-17 - **Last Updated**: 2025-09-17 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # factorflow ## 介绍 专注于量化研究,包括规则、多因子研究、组合等,使用 dolphinDB 和多个数据源结合的方式进行开发回测。 ## 目录结构说明 1. data/ 目录 * raw/:存储从不同数据源获取的原始数据,按数据源分类(DDB、API、SQL、本地文件)。 * processed/:存储处理后的数据,如因子数据、特征工程数据。 * models/:存储模型相关数据,包括训练好的模型和预测结果。 2. ddb_scripts/ 目录 * 存放所有与 DolphinDB 相关的脚本,按功能分类(因子计算、工具函数、数据加载等)。 * 支持模块化加载,便于在 Python 中调用。 3. notebooks/ 目录 * 用于研究和实验的 Jupyter Notebooks,按研究流程分类(数据探索、因子生成、模型训练、回测分析)。 4. src/ 目录 * data_loader/:数据加载模块,支持多数据源(DDB、API、SQL、本地文件)。 * factor_generator/:因子生成模块,包括基础因子和机器学习因子。 * models/:模型训练和评估模块。 * utils/:工具模块,如数据预处理、日志工具。 * main.py:项目主入口,用于整合各模块功能。 5. config/ 目录 * 存放配置文件,如数据库连接信息、API 密钥、路径配置等。 * 使用 yaml 文件格式,便于读取和修改。 6. tests/ 目录 * 存放单元测试代码,确保各模块功能正确性。 7. 其他文件 * requirements.txt:Python 依赖库列表。 * README.md:项目说明文档,包括项目简介、目录结构、使用指南等。 * gitignore:Git 忽略文件,避免将不必要的文件(如缓存数据)提交到版本控制。 8. 多数据源支持 * DolphinDB:通过 ddb_loader.py 和 ddb_scripts/ 实现数据加载和计算。 * API:通过 api_loader.py 实现数据加载,支持 RESTful API 或其他接口。 * SQL:通过 sql_loader.py 实现数据加载,支持 MySQL、PostgreSQL 等数据库。 * 本地文件:通过 local_loader.py 实现数据加载,支持 CSV、Excel、Parquet 等格式。