GLM-ASR-Nano-2512 本地语音识别服务
GLM-ASR-Nano-2512 本地语音识别服务
3分钟快速部署,支持麦克风实时输入,中文普通话、粤语、英文混合识别
核心特性
专为中文场景深度优化的轻量级语音识别模型,1.5B参数,4.5GB体积,开箱即用
实时语音识别
支持麦克风实时输入,最长10分钟连续识别,边说边出字,适合访谈记录、课堂笔记
实时处理 自动分段多语言支持
中文普通话、粤语、英文混合识别,无需切换语言模式,自动检测并准确识别
普通话 粤语 英文本地部署
所有计算都在本地完成,无需联网,保护隐私安全,适合敏感场景使用
隐私保护 离线可用文件批量处理
支持WAV/MP3/FLAC/OGG格式,一次可传10个文件,批量识别后导出TXT或SRT字幕
批量上传 多格式支持智能优化
针对低信噪比环境优化,远场拾音、嘈杂环境、耳语级输入都能准确识别
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/252879.html