科大讯飞开源星火化学大模型和文生音效模型

科技前沿 • 2026-03-13 19:24 • 阅读 0

大家好，我是讯享网，很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。

 <p></p>

科大讯飞最近推出了两款开源大模型：星火化学大模型 spark chemistry-x1-13b 与文生音频模型 audiofly，旨在推动化学前沿研究及声音生成技术的发展与应用探索。

Spark Chemistry-X1-13B 基于星火 X1 大模型底座打造，专为化学领域任务进行了深度优化。该模型融合了快慢思考机制，并创新性地引入解耦注意力掩码技术，在化学知识问答、分子结构解析、性质预测等关键任务中表现优异，显著超越主流通用大模型，为化学AI和跨学科研究提供了强有力的技术支撑。

科大讯飞开源星火化学大模型和文生音效模型

核心优势

双模推理架构：结合链式思维（CoT）与双过程理论，构建统一框架，支持快速反应与深度推理两种模式
稳定混合训练：通过创新的注意力掩码策略，实现不同推理路径训练过程的分离，避免数据分布干扰，提升训练稳定性
专业化学优化：针对以下典型场景进行多阶段精细化调优：
- 高阶化学知识问答
- 化学命名与结构互转
- 分子特性预测分析

AudioFly 是一款基于文本生成音频的生成式模型，能够依据文字描述合成高保真音效，输出采样率达 44.1 kHz，音质清晰且语义对齐度高。

该模型采用潜在扩散架构，参数量达十亿级别，并在大规模、多样化的音频文本数据集上完成训练，涵盖 AudioSet、AudioCaps、TUT 等公开数据集以及丰富的内部专有数据。无论是单一声音事件还是复杂多事件场景，AudioFly 均能生成准确贴合描述内容的音频。在 AudioCaps 基准测试中，其表现已超越此前主流音频生成模型。

科大讯飞开源星火化学大模型和文生音效模型

开源地址：

科大讯飞开源星火化学大模型和文生音效模型

相关推荐