2025年aeneas 实现音频强制对齐

aeneas 实现音频强制对齐做英语学习类产品经常会遇到读句子的时候针对单个单词的类卡拉 ok 的高亮效果 这里记录一下音频进度和单词的一一对应关系 类似于歌词文件 粒度为单词级别 如何生成 纯人工来校对的话人工成本还是比较大的 专业的词语是强制对齐 Forced Alignment 这里介绍 python 库 aeneas

大家好,我是讯享网,很高兴认识大家。

http://www.readbeyond.it/aeneas/

使用方式:

1.安装软件
一键安装包(windows版本和mac版本)
https://github.com/sillsdev/aeneas-installer/releases

config.txt //配置文件 包含格式、输出路径等 audios/ //音频和句子信息 -- Can_you_see_me.txt //包含对应句子文本 -- Can_you_see_me.m4a //对应音频。 与文本文件名一致 -- Yes_can.txt //可批量操作 -- Yes_can.m4a 
讯享网

4.生成成功。到输出目录下找对应的文件生成文件。可自己写个简单的h5,上传生成的json和音频做准确率校验。

5.Windows下aeneas错误处理。the default input encoding is not UTF-8.You might want to set ‘PYTHONIOENCODING=UTF-8’ in your shell. 解决方案,终端进入python安装目录下,执行命令如:

讯享网cd C:\Python27\Scripts set PYTHONIOENCODING=UTF-8 

6.config.txt配置,包含路径、格式等信息。

is_hierarchy_type=flat
is_hierarchy_prefix=audios/
is_text_file_relative_path=.
is_text_file_name_regex=.*\.txt
is_text_type=mplain
is_audio_file_relative_path=.
is_audio_file_name_regex=.*\.m4a
is_audio_file_detect_head_max=10.000
is_audio_file_detect_tail_max=10.000

os_job_file_name=output_example1
os_job_file_container=zip
os_job_file_hierarchy_type=flat
os_job_file_hierarchy_prefix=audios/
os_task_file_name=$PREFIX.json
os_task_file_format=json
os_task_file_smil_page_ref=$PREFIX.xhtml
os_task_file_smil_audio_ref=$PREFIX.m4a
os_task_file_levels=3



job_language=en
job_description=Example 1 (flat hierarchy, parsed text files)

7.输出。

讯享网{ "fragments": [ { "begin": "1.560", "end": "2.070", "lines": [ "Thanks" ] }, { "begin": "2.070", "end": "2.360", "lines": [ "for" ] }, { "begin": "2.360", "end": "2.950", "lines": [ "taking" ] }, { "begin": "2.950", "end": "3.405", "lines": [ "care" ] }, { "begin": "3.405", "end": "3.750", "lines": [ "of" ] }, { "begin": "3.750", "end": "4.140", "lines": [ "my" ] }, { "begin": "4.140", "end": "4.520", "lines": [ "dog!" ] } ] } 

github地址:https://github.com/liusaint/ls-blog/issues/36

小讯
上一篇 2025-03-01 12:49
下一篇 2025-01-28 22:30

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/53826.html