Qwen3-TTS 开发者API接口对接文档

Qwen3-TTS 开发者API接口对接文档Qwen3 TTS 是阿里巴巴通义千问团队开源的新一代多语言文本转语音模型 依托 Qwen3 大模型体系打造 提供高拟人度自然音色 覆盖中 英 日 韩等 10 种主流语言与多种方言 音色表现力丰富 模型支持声音复刻 与声音设计 双定制路径 3 秒短音频即可完成高保真声纹复刻 也可通过自然语言描述直接生成专属虚拟音色 基础 URL https www yuntts com api v1

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



Qwen3-TTS 是阿里巴巴通义千问团队开源的新一代多语言文本转语音模型,依托 Qwen3 大模型体系打造,提供高拟人度自然音色,覆盖中、英、日、韩等 10 种主流语言与多种方言,音色表现力丰富。模型支持声音复刻声音设计双定制路径:3 秒短音频即可完成高保真声纹复刻,也可通过自然语言描述直接生成专属虚拟音色。

Qwen3-TTS 开发者API接口对接文档 1

基础URL: https://www.yuntts.com/api/v1

认证方式: 在请求头中添加 Authorization: Bearer {api_key}


接口 路径 方法 说明 语音合成 https://www.yuntts.com/qwen3-synthesize POST 将文本转换为语音 声音克隆 https://www.yuntts.com/qwen3-create-voice POST 基于音频样本克隆音色 声音设计 https://www.yuntts.com/qwen3-create-design-voice POST 基于文本描述设计音色 删除音色 https://www.yuntts.com/qwen3-delete-voice POST 删除已创建的音色

URL: POST https://www.yuntts.com/api/v1/qwen3-synthesize

Content-Type: application/json

Headers:

Authorization: Bearer {api_key} Content-Type: application/json
参数名 类型 必填 说明 model string 是 合成模型, voice string 是 音色ID,系统音色或自定义音色 text string 是 要合成的文本,最长500Token language_type string 否 语言类型: Auto(默认), Chinese, English, Japanese, Korean 等 response_format string 否 输出格式: mp3(默认), wav, pcm, ogg sample_rate int 否 采样率:16000, 24000(默认), 44100, 48000 instructions string 否 指令控制(仅Instruct模型支持) optimize_instructions boolean 否 是否优化指令,默认false
{ "model": "qwen3-tts-instruct-flash", "voice": "Cherry", "text": "欢迎使用语音合成服务", "language_type": "Chinese", "response_format": "mp3", "sample_rate": 24000 }
{ "code": 200, "message": "语音合成成功", "data": { "audio": { "url": "https://xxx.oss-cn-beijing.aliyuncs.com/xxx.mp3", "id": "audio_xxx", "expires_at":  }, "finish_reason": "stop" }, "char_count": 10, "cost": 0.01 }

基于音频样本快速复刻音色,打造拟人化品牌声纹。

项目 要求 支持格式 WAV (16bit)、MP3、M4A 音频时长 推荐10~20秒,最长60秒 文件大小 < 10 MB 采样率 ≥ 24 kHz 声道 单声道

URL: POST https://www.yuntts.com/api/v1/qwen3-create-voice

Content-Type: multipart/form-data

Headers:

Authorization: Bearer {api_key}
参数名 类型 必填 说明 name string 是 音色名称,最多20字符 target_model string 是 目标模型:仅支持 qwen3-tts-vc-2026-01-22 file file 是 音频文件 language string 否 语言: zh(默认), en, ja, ko description string 否 音色描述 preferred_name string 否 音色前缀,默认 yuntts
curl -X POST https://www.yuntts.com/api/v1/qwen3-create-voice -H "Authorization: Bearer {api_key}" -F "name=我的音色" -F "target_model=qwen3-tts-vc-2026-01-22" -F "language=zh" -F "file=@/path/to/audio.mp3"
 }

通过文本描述生成定制化音色,无需音频样本。

URL: POST https://www.yuntts.com/api/v1/qwen3-create-design-voice

Content-Type: application/json

参数名 类型 必填 说明 name string 是 音色名称,最多20字符 target_model string 是 目标模型:仅支持 qwen3-tts-vd-2026-01-26 voice_prompt string 是 声音描述,最多2048字符 preview_text string 是 预览文本 language string 否 语言: zh(默认), en 等 description string 否 音色描述

注意:仅支持非流式模型,不支持实时流式模型

维度 描述示例 性别 男性、女性、中性 年龄 儿童、青少年、青年、中年、老年 音调 高音、中音、低音 语速 快速、中速、缓慢 情感 开朗、沉稳、温柔、严肃、活泼 特点 有磁性、清脆、沙哑、圆润、甜美

推荐示例:

  • "年轻活泼的女性声音,语速较快,适合介绍时尚产品"
  • "沉稳的中年男性,语速缓慢,音色低沉有磁性,适合新闻播报"
 }

URL: POST https://www.yuntts.com/api/v1/qwen3-delete-voice

Content-Type: application/json

参数名 类型 必填 说明 modelId string 是 音色ID(也支持 voice 参数名)
  • 只有音色创建者和管理员可以删除
  • 删除前会验证权限
{ "modelId": "qwen-tts-vc-yuntts-voice-xxx" }

{ “code”: 200, “message”: “删除成功” }

场景 推荐模型 说明 通用语音合成 qwen3-tts-instruct-flash 按字符计费,支持指令控制 声音复刻 qwen3-tts-vc-2026-01-22 基于音频样本克隆音色 声音设计 qwen3-tts-vd-2026-01-26 基于文本描述创建音色
  • qwen3-tts-instruct-flash - 支持指令控制的语音合成模型
  • 声音克隆模型qwen-voice-enrollment
  • 驱动音色的语音合成模型
    • qwen3-tts-vc-2026-01-22(非流式,推荐)
  • 声音设计模型qwen-voice-design
  • 驱动音色的语音合成模型
    • qwen3-tts-vd-2026-01-26(非流式,推荐)

重要提示:创建音色时指定的 target_model 必须与后续语音合成时使用的模型一致


  • 汉字按 2 个字符计算
  • 其他字符(英文、数字、符号等)按 1 个字符计算
模型 价格 qwen3-tts-vc-2026-01-22 2.0 qwen3-tts-vd-2026-01-26 2.0 qwen3-tts-instruct-flash 1.5 其他模型 1.5
  • 永久会员: 8 折
  • VIP会员: 9 折
  • 仅会员用户可享受
  • 每月免费额度可在后台设置
  • 免费额度用完后正常计费
  • 每次合成最低扣费 0.01 元

  1. 计算字符数
  2. 根据模型计算基础费用
  3. 应用会员折扣
  4. 使用免费额度(如有)
  5. 扣除余额(如需要)
  6. 调用 API
  7. 失败自动退款

HTTP 状态码 错误码 说明 400 model_required 模型参数不能为空 400 voice_required 音色参数不能为空 400 text_required 文本参数不能为空 400 insufficient_balance 余额不足 400 model_limit_exceeded 模型数量超过限制 401 - 未授权或 API Key 无效 403 permission_denied 没有权限删除该音色 404 voice_not_found 音色不存在 500 api_request_failed API 请求失败 500 balance_deduction_failed 余额扣除失败 500 order_creation_failed 订单创建失败 500 synthesis_failed 语音合成失败

  1. 声音复刻/设计与语音合成的关联:创建音色时指定的 target_model 必须与后续语音合成时使用的模型一致
  2. 音频URL有效期:非流式合成返回的音频URL有效期为24小时
  3. 模型限制
    • 普通用户最多创建 2 个音色
    • VIP 会员用户最多创建 10 个音色
    • 永久会员 用户无限制

小讯
上一篇 2026-04-08 17:54
下一篇 2026-04-08 17:52

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/251867.html