2025年amr转pcm_奉旨折腾——语音转文字软件折腾记

amr转pcm_奉旨折腾——语音转文字软件折腾记我听过荒芜变成热闹 听过尘埃掩埋城堡 听过天空拒绝飞鸟 没听过你 加班王 开心她娘又开始加班了 这次是打开电脑听起了会议录音 听了没几分钟她忽然停下了手 叫住想要偷偷溜去打呼的我 有没有录音转文字的软件可以帮我处理一下 时间就是金钱

大家好,我是讯享网,很高兴认识大家。

我听过荒芜变成热闹,听过尘埃掩埋城堡,听过天空拒绝飞鸟,没听过你 ~~

“加班王”开心她娘又开始加班了,这次是打开电脑听起了会议录音。听了没几分钟她忽然停下了手,叫住想要偷偷溜去打呼的我:有没有录音转文字的软件可以帮我处理一下?

时间就是金钱,LD的问题就是命令!

可以奉旨折腾,还可以顺便减轻一下老婆大人的工作量,这问题必须解答啊,这活必须得干啊。

90bce0a8dcb9f21e12f5cd6f0026943c.png
讯享网

其实成熟又免费的方案,早就有了,本钳工有过成功实践:

2018年,曾经帮助同事扒了一次某老视频中的英文解说音轨,提交给翻译同学去整成中文。这个方案里的关键部分在于,需要把语音或视频上传到油管,通过它的语音识别功能自动生成字幕,再通过其他网站调用字幕下载api,下载到本地,完成视频或语音转文字的骚操作。(帝国主义的科技实力时至今日依然不容小觑,吾辈不能夜郎自大,得迎头赶上啊)。

然而,由于某些你懂的原因,这个方案最近不太好使,只能另避蹊径了。

本着“知之为知之,不知Google知(误)Baidu之”的指导思想,打开搜索引擎,上网开搞,let's Zhe'Teng,走着!

搜索“录音如何转文字”,发现这个领域上倒是有不少玩家,不过大部分收费,免费的很少。闲话不多说,接下来就为各路朋友,把我找到的软件/网页人肉测试一番:

1.免费玩家

虽然目前语音输入法已经相当成熟,但长时间的会议录音转文字,目前应该还是个需要实力的技术活,因此整个网络上能找到的免费服务并不多。

  • 网易见外

网易见外算是免费服务里的大牌玩家了,根据网络信息:“网易见外是网易自营的智能转写翻译平台,见外工作台面向个人用户,提供视频编译、视频转写、字幕翻译、文档翻译、语音翻译、语音转写、会议同传、图片翻译等功能,免费使用。”免费提供这么多服务,真是谢谢丁三石丁老板呐。

尽管今年3月网易发布公告要关闭网易见外服务,但实测目前并未真正关闭,依然可以登录工作台。

而服务何时会真正关闭时间未知,总之抓紧用,用一天少一天的节奏。

651ea683ed012c118792ccd7fd54ab9f.png

但是测试结果就一言难尽。本次实际测试了某次会议录音,wav格式,时长37分钟,识别出来的文字完全驴唇不对马嘴……

所以虽然人家丁老板不见外,这免费的猪肉(误)午餐也不是那么好吃的。

  • i笛云听写

i笛云听写是另一个免费的音频转文字网盘,知乎上有个暴力测评说这是个“逐字稿神器”,说“i笛云听写创新性地将转写文本与音频做了对应处理,支持双向定位,能更好地处理逐字稿”。说的这么牛掰,那必须试试了。

53c4ad78cbe670fa75af73b7aaaf3e6d.png本次同样用某次会议录音测试,wav格式,时长37分钟。结果嘛,如下图所示:

f7e01fe458471ac15c6afbccc6b8ee3b.png

鲜红的转写失败!惹不起惹不起,byebye吧您呐~

2.折腾小萌新

  •     自建服务

免费的服务好像都不太好使,那么略懂一点皮毛的技术小萌新能不能尝试一下自建音频转文字服务?毕竟知乎上有个大牛的回答里提到过:“各家语音识别的API都蛮好用的,又便宜,能不能自己套个壳做个平台?”看到这么励志的话语,作为爱折腾的小萌新,也是备受鼓舞,撸起袖子就想自力更生艰苦创业去了。

仔细看了看知乎里排序最高的回答,简单总结如下:

  • 腾讯云(每月30小时免费额度,超出的0.95-1.75元/每小时)
  • 腾讯AI开放平台(目前完全免费)
  • 阿里云(1元-2.5元每小时)

  • 科大讯飞(5小时免费额度,超出3.4-6.9元/小时)

看完感觉马老板够意思,完全够用了,您老人家啥时候生日,到时候我把您大寿消息转发十几个,能不能送个免费的界面?

这一边,科大讯飞则贴心的提供了Python3 和 Java 的Demo,

答主还分享了自己的github链接,好评!收藏!估计假以时日,鼓捣鼓捣也许真能出个东西吧,留待以后继续研究。

但仅就目前而言,自建服务显然远水不解近渴,暂时是用不上了。

3.氪金玩家:

  •     讯飞听见

科大讯飞当前在中文语音识别领域,显然是当仁不让的一哥,技术实力毋庸置疑。虽然爆出过使用真人翻译,假装机器翻译的超级大丑闻,但并不能抹杀其在语音识别上的深厚造纸造诣e8dc3b1bd7a4559643068ec14192c573.png,号称识别结果准确率95%(结果由安徽电子产品监督检验所评测所得)。论收费服务,他说第二没人敢说第一。

讯飞听见提供的是网页界面,支持上传时长两小时以内,文件大小小于5G的音视频文件,支持格式包括:mp3、wav、pcm、m4a、amr、wma、aac、mp4、3gp等。

898a05de99f6aa09b1f4e78d16c6564b.png

实际测试了某次会议录音,wav格式,时长37分钟,5分钟搞定,目测识别率很棒,准确率有没有到95%不知道,反正很棒就是了。

收费情况:0.33元/分钟,注册后,送免费的一个小时转换时长。合计下来一个小时得20元,略贵,肉疼,不差钱的氪金玩家上吧。

  • 录音啦

录音啦号称也是讯飞旗下的录音转文字识别工具,既然是讯飞自己人,识别率估计应该不会低。但是下载安装后,这个界面真的吓了我一跳,这真的不是某个人开发者做出来的软件?这是2020年的中国IT公司?因为实在看不上这个界面的颜值,我直接拒绝测试了(就是这么任性)。

939142f8dc62322efd7346b1f79e9da7.png

颜值低倒是也有颜值低的好处:身价也低。月卡会员一个月30,平均一天只不到一块钱,无限制使用。年卡会员更是只需要120元。要不然说颜值就是正义呢?唉,对这个看脸的世界绝望了……

手机用户录音利器

  • 有道云笔记

另外再推荐一个手机录音利器,是的,老朋友——有道云笔记。

有道云笔记曾经用了多年,个人感觉比印象笔记本土化做的好太多了,要不是有了完全不受限制的群晖note,我当年根本不忍心换掉这款堪称网易家最完美的app。这次发现,相比手机自带的录音功能,有道云笔记作为一款备忘记事类工具,提供了OCR和语音记事服务。通过竖向的时间轴将文字与音频做了对应处理,让手机小屏编辑有了不小的体验提升。

15a331c16e2538553a581fdc8e21d69a.png当然,它的语音识别能力只是个加分项,一个手机app要让它和讯飞的云上服务比,这不公平。至少,它比录音笔好用多啦,强烈推荐。

最终总结:

  • 想免费撸服务的同学,您也别见外,推荐免费使用网易见外,反正识别起来靠运气;
  • 不差钱的氪金玩家,强烈推荐讯飞听见,识别起来稳准狠!
  • 愿意花点钱又在乎性价比的玩家,推荐用录音啦,*丝界面*丝价格。
  • 使用手机录音做会议记录的,推荐用有道云笔记-语音速记

以上均为一家之言,全靠钳工本人肉眼判断。

假如有哪位同学对测试结果不服的话,你来打我呀~

好了,就到这里,byebye

b2c69c0894fe2682cc49a1aad9cb54b8.png

小讯
上一篇 2025-01-29 19:14
下一篇 2025-02-16 22:23

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/24912.html