🔥🔥🔥Java免费离线AI算法工具箱,支持人脸识别,活体检测,表情识别、目标检测、实例分割、行人检测、OCR文字识别、车牌识别、表格识别、ASR+TTS、机器翻译等功能,Maven引用即可使用。支持PyTorch、Tensorflow,已集成 Mtcnn、InsightFace、SeetaFace6、YOLOv8~v12、PaddleOCR(PPOCRv5)、Whisper等主流模型
最近更新: 4天前该服务实现了一个端到端的实时语音交互系统,核心流程为:音频流接收→VAD 检测语音片段→(可选)说话人验证→ASR 转文本→表情格式化→实时返回。适用于需要实时语音转写并增强可读性(如带情感 / 事件表情)的场景,如实时会议记录、语音助手等。
最近更新: 15天前一个面向求职者的智能化虚拟面试平台后端:基于 Spring Boot +Spring AI + MySQL + Redis + WebSocket,集成科大讯飞大模型(对话/面试官)、RAG 知识库增强、ASR 实时转写与 TTS 语音合成,并提供面试过程分析报告、面经社区与简历管理,助力高效模拟与提升面试能力。
最近更新: 15天前🔥🔥🔥基于websocket实现浏览器端文本、视频、语音的即时通讯,以及实时语音转文字
最近更新: 15天前springboot的各种问题的解决的方案
最近更新: 1个月前Java开发视觉智能识别项目 纯java 调用 yolo onnx 模型 AI 视频 识别 支持 yolov5 yolov8 yolov7 yolov9 yolov10,yolov11,paddle ,obb,seg ,detection,包含 预处理 和 后处理 。java 目标检测 目标识别,可集成 rtsp rtmp,车牌识别,人脸识别,跌倒识别,打架识别,车牌识别,人脸识别 等
最近更新: 3个月前ERD Online 是全球第一个开源、免费在线数据建模、元数据AI平台。集成ChatGPT,提供简单易用的元数据设计、关系图设计、SQL审批查询等功能,辅以版本、导入、导出、数据源、SQL解析、审计、团队协作等功能,方便我们快速、安全的管理数据库中的元数据。
最近更新: 3个月前