随着大模型与多模态能力持续爆发,语音交互正成为新一代输入风口。像手机端的豆包语音输入法(豆包输入法正式版发布!搜狗输入法代替品!),凭借精准识别、智能断句、自然流畅,收获大量好评。
但豆包语音输入法目前尚未发布 Windows 版本,电脑端想用上同款体验并不容易。市面上其它语音输入工具,要么依赖云端 API、需要按量付费。
最近,微软直接甩出王炸,开源了超强语音转文本模型 VibeVoice-ASR,并基于它推出了一款开箱即用的语音识别输入工具「Vibing」提供了 Windows 和 macOS 客户端。
VibeVoice-ASR 是微软开源的90 亿参数统一语音识别大模型,在 GitHub 上收获海量 Star,堪称当前 ASR 领域的 “长语音王者”。50 + 语言支持:中英混合、多语种切换都能稳识别,不切片、不拼凑:一次性处理长达 60 分钟音频,64K 超长上下文,全程语义连贯。

免费、开源、开箱即用的 Windows 语音识别输入工具「Vibing」使用很简单,按下快捷键 Ctrl+Win 即可快速激活语音转文本,在 Word、浏览器、聊天窗口等任意输入框都能直接用,不用切换软件。

按下 Ctrl+Win+Alt 支持语音翻译,可直接外语转中文,也能中文转其他语言,翻译准确、延迟极低,跨境沟通、外文听写都能用。

自定义热词,专业场景更准支持添加行业术语、专属名词,解决专业词汇识别不准的问题,科研、法务、技术岗都适配。

在语音输入成为刚需的今天,微软 VibeVoice-ASR + Vibing 组合,不用花钱买 API,一键唤起、超长语音、多语言翻译、说话人区分,全部拉满。可以说是目前最省心的开源语音输入法之一。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/262776.html