科大讯飞开源星火化学大模型和文生音效模型

科大讯飞开源星火化学大模型和文生音效模型p p 科大讯飞最近推出了两款开源大模型 星火化学大模型 spark chemistry x1 13b 与文生音频模型 audiofly 旨在推动化学前沿研究及声音生成技术的发展与应用探索 Spark Chemistry X1 13B 基于星火 X1 大模型底座打造 专为化学领域任务进行了深度优化 该模型融合了快慢思考机制

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



 <p></p> 

科大讯飞最近推出了两款开源大模型:星火化学大模型 spark chemistry-x1-13b 与文生音频模型 audiofly,旨在推动化学前沿研究及声音生成技术的发展与应用探索。

Spark Chemistry-X1-13B 基于星火 X1 大模型底座打造,专为化学领域任务进行了深度优化。该模型融合了快慢思考机制,并创新性地引入解耦注意力掩码技术,在化学知识问答、分子结构解析、性质预测等关键任务中表现优异,显著超越主流通用大模型,为化学AI和跨学科研究提供了强有力的技术支撑。

科大讯飞开源星火化学大模型和文生音效模型

核心优势

  • 双模推理架构:结合链式思维(CoT)与双过程理论,构建统一框架,支持快速反应与深度推理两种模式
  • 稳定混合训练:通过创新的注意力掩码策略,实现不同推理路径训练过程的分离,避免数据分布干扰,提升训练稳定性
  • 专业化学优化:针对以下典型场景进行多阶段精细化调优:
    • 高阶化学知识问答
    • 化学命名与结构互转
    • 分子特性预测分析

AudioFly 是一款基于文本生成音频的生成式模型,能够依据文字描述合成高保真音效,输出采样率达 44.1 kHz,音质清晰且语义对齐度高。

该模型采用潜在扩散架构,参数量达十亿级别,并在大规模、多样化的音频文本数据集上完成训练,涵盖 AudioSet、AudioCaps、TUT 等公开数据集以及丰富的内部专有数据。无论是单一声音事件还是复杂多事件场景,AudioFly 均能生成准确贴合描述内容的音频。在 AudioCaps 基准测试中,其表现已超越此前主流音频生成模型。

科大讯飞开源星火化学大模型和文生音效模型

开源地址:

小讯
上一篇 2026-03-13 19:23
下一篇 2026-03-13 19:25

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/216994.html