2025年Riva快速入门(操作指南)

Riva快速入门(操作指南)Riva 快速入门 数据中心平台操作指南 NVIDIA Riva Speech Skills 快速入门指南是试用 Riva 的起点 具体来说 本指南使您能够在本地工作站上快速部署预训练模型并运行客户端示例 Riva Speech Skills 支持两种架构 Linux x86 64 和 Linux ARM64

大家好,我是讯享网,很高兴认识大家。

Riva快速入门(数据中心平台操作指南)

Riva Speech Skills 支持两种架构,Linux x86_64 和 Linux ARM64。这些在本文档中被称为数据中心 (x86_64) 和嵌入式 (ARM64),Linux ARM64架构的嵌入式平台操作指南将在下一章节进行说明。

一 :数据中心平台使用的先决条件

  • 您可以访问并登录到 NVIDIA NGC。有关分步说明,请参阅 NGC 入门指南。
  • 您可以使用Linux x86_64架构的操作系统和NVIDIA Volta™、NVIDIA Turing™ 或基于 NVIDIA Ampere 架构的GPU。
  • 下图截选了Riva Speech Skills 2.1.0 在数据中心平台上支持的GPU硬件。详情请参考Support Matrix
  • 您安装了支持 NVIDIA GPU 的 Docker。详情请参阅Support Matrix

二:可供部署的模型

  • 本地化Docker: 您可以使用快速入门脚本结合Docker部署Riva服务。
  • Kubernetes: Riva Helm Chart设计用于自动化Kubernetes集群的按钮部署步骤, 嵌入式平台不支持此选项。

Note:另外除了使用预先训练的模型,Riva技能可以使用NVIDIA TAO工具包运行微调自定义模型。 有关使用TAO Toolkit创建模型存储库的高级选项的详细信息请参阅使用TAO Toolkit进行模型开发一节。

三:本地快速启动脚本部署

ngc registry resource download-version nvidia/riva/riva_quickstart:2.1.0

讯享网



2.下载完成后进入快速启动脚本目录中

讯享网cd riva_quickstart_v2.1.0



3.初始化并启动Riva(初始化步骤将会下载并准备Docker映像和模型, start命令启动服务器)

bash riva_init.sh bash riva_start.sh



4.对于数据中心平台,为每个服务启动都带有示例客户端的客户端容器。可以通过以下命令开启客户端:

讯享网bash riva_start_client.sh



5.客户端开启后,从客户端容器内部可以使用容器所提供的 Jupyter 笔记本,通过以下指令开启jupyter notebook并使用脚本案例。

jupyter notebook --ip=0.0.0.0 --allow-root --notebook-dir=/work/notebooks



Note:如果在云服务提供商(例如 AWS 或 GCP)上运行 Riva 快速启动脚本,请确保您的计算实例具有外部可见的 IP 地址。要运行 Jupyter 笔记本,请将浏览器窗口连接到该外部 IP 地址的正确端口(默认为 8888)


讯享网

6.完成试验步骤并实现推理后,若想停止服务器则运行:

讯享网bash riva_stop.sh



有关如何自定义本地部署的更多详细信息请参阅 Local (Docker)

进行离线语音识别指令:

riva_asr_client --audio_file=/work/wav/en-US_sample.wav



进行流式语音识别指令:

讯享网riva_streaming_asr_client --audio_file=/work/wav/en-US_sample.wav 


注意:
–audio_file参数用来指定需要进行语音识别的语音文件的路径。
如果使用 SSL/TLS,请确命令中保包含 --ssl_server_cert /ssl/server.crt 参数选项。

riva_tts_client --voice_name=English-US-Female-1 \                 --text="Hello, this is a speech synthesizer." \                 --audio_file=/work/wav/output.wav



注意:
–voice_name:选择语音合成的声音样本
–text:指定需要进行语音合成的文字
–audio_file: 合成出来的音频文件output.wav存储在 /work/wav 目录中。

总结
在本快速入门指南中,您了解到了如何使用预训练模型部署Riva 服务器和使用命令行 API 的基础知识。

  • 初始化启用Riva服务器
  • 启动Riva客户端
  • 通过 Jupyter 笔记本使用 Riva API
  • 客户端执行 Riva 命令行完成语音识别
  • 客户端执行 Riva 命令行完成语音合成
  • 有关如何在实际应用中使用 Riva 技能的更多示例,您可以关注虚拟助手演示
  • 有关微服务gRPC可以参考 gRPC gRPC & Protocol Buffers
  • 更多的客户端命令行可参考 API Command-line Clients

 

小讯
上一篇 2025-01-05 20:15
下一篇 2025-03-23 23:09

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/47879.html