2025年nvim 配置文件(nvidia配置文件)

nvim 配置文件(nvidia配置文件)p class f center p

大家好,我是讯享网,很高兴认识大家。




讯享网

                <p class="f_center"><img src="https://nimg.ws.126.net/?url=http%3A%2F%2Fdingyue.ws.126.net%2F2024%2F1104%2Fb55d53c3j00smf8to000md000hs009gg.jpg&thumbnail=660x2147483647&quality=80&type=jpg"/><br/><br/></p><p id="3558R4B5">在人工智能飞速发展的今天,大语言模型(LLM)为各个行业带来了全新的场景和机遇。诸如客户服务数字人,计算机辅助药物研发的生成式虚拟筛选,基于检索增强生成(RAG)的企业多模态 PDF 数据提取,网络安全流数据过滤、处理和分类优化等工作流,正在无缝集成和运行在定制化的企业 AI 应用,企业还能够基于专有业务数据和用户反馈数据,不断优化 AI 应用。</p><p id="3558R4B7">同时,企业也面临着如何高效、安全地部署 LLM 的挑战。阿里云计算巢基于 NVIDIA 加速计算技术,通过阿里云云市场为企业和开发者提供<strong>NVIDIA AI Enterprise</strong>软件套件,其包含了<strong>NVIDIA NIM™ Agent Blueprint</strong>、<strong>NVIDIA NIM</strong>和<strong>NVIDIA NeMo™</strong>等企业级 AI 开发工作流和 AI 开发工具链。其中,NVIDIA NIM 提供可靠、高性能的 LLM 推理服务,结合阿里云计算巢实现一站式云上部署,助力企业加速实现 LLM 的 SaaS 化。</p><p id="3558R4B9">本文以 Llama3 为例,介绍该方案的整体架构和部署方式。</p><p id="3558R4BB"><strong>NVIDIA NIM:</strong></p><p id="3558R4BC"><strong>易于使用的预构建容器工具</strong></p><p id="3558R4BE">NVIDIA NIM 微服务是一套易于使用的预构建容器工具,目的是帮助企业客户在云、数据中心和工作站上安全、可靠地部署高性能 AI 模型。作为 NVIDIA AI Enterprise 的一部分,NIM 具备以下核心优势:</p><p><ul><li id="3558R4EA"><strong>安全、灵活的部署:</strong>NIM 在不同环境的 CUDA GPU 加速基础设施和 Kubernetes 发行版中经过严格验证和基准测试,它支持企业在云、数据中心、工作站上安全可靠地部署高性能的 AI 推理,只需 5 分钟即可完成部署。</li><li id="3558R4EB"><strong>加速产品上市:</strong>企业通过预构建、持续维护的微服务,能够快速将产品推向市场,缩短开发周期。</li><li id="3558R4EC"><strong>开发者友好:</strong>开发者使用标准 API 和几行代码即可轻松将 NIM 集成到企业级 AI 应用程序中。</li><li id="3558R4ED"><strong>优化的推理引擎:</strong>NIM 基于<strong>Triton™ 推理服务器</strong><strong>TensorRT</strong><strong>TensorRT-LLM</strong>和 PyTorch 等强大的推理引擎构建, 提供行业领先的吞吐率、延迟和 token 生成速度,确保服务响应更快。</li><li id="3558R4EE"><strong>企业级支持:</strong>NIM 采用企业级基础容器构建,提供严格的验证、定期安全更新,适合企业生产环境部署。</li></ul></p><p id="3558R4BH"><strong>阿里云计算巢:专为服务商</strong></p><p id="3558R4BI"><strong>及其客户打造的云集成 PaaS 平台</strong></p><p id="3558R4BK">阿里云计算巢服务是一个开放给企业应用服务商(包括:企业应用服务商、IT 集成服务商、交付服务商和管理服务提供商等)及其用户的服务管理 PaaS 平台,提供软件上云的“一站式”解决方案。</p><p id="3558R4BM">阿里云计算巢能提供软件的交付、部署、运维流程标准化的服务,支持软件和资源的一体化交付,真正实现了软件的开箱即用。</p><p id="3558R4BO">阿里云计算巢服务集成了阿里云一系列底层产品能力,通过通用的应用管控框架、租户管理框架,帮助服务商提升服务的交付效率、管理效率和服务能力,在提升用户满意度的同时降低运营成本;并为用户提供了统一管理多种应用服务的平台,提升用户使用服务的效率和安全性,降低用户获取服务和管理服务的成本。</p><p id="3558R4BQ"><strong>方案介绍</strong></p><p id="3558R4BS">下图展示了通过阿里云计算巢快速部署 NVIDIA NIM 的整体架构。以 Llama3 为例,我们通过计算巢来创建、管理 LLM 推理服务:在阿里云容器服务 ACK (容器服务 Kubernetes 版)集群上,我们使用阿里云 ACK 的云原生 AI 套件,集成开源推理服务框架 KServe,来部署 NVIDIA NIM。</p><p id="3558R4BU">同时,结合 ACK 的 Prometheus 和 Grafana 监控服务,快速搭建监控大盘,实时观测推理服务状态;利用 NVIDIA NIM 提供丰富的监控指标,如 num_requests_waiting,配置推理服务弹性扩缩容策略。</p><p id="3558R4C0">这里列出的云上资源,以及阿里云弹性计算服务(ECS)、专有网络(VPC) 等基础资源,都可以通过计算巢来轻松配置,一键拉起,最终实现一个云上高性能、可实时观测、极致弹性的大语言模型推理服务。用户只需要根据该服务创建实例,便可部署该服务。</p><p class="f_center"><img src="https://nimg.ws.126.net/?url=http%3A%2F%2Fdingyue.ws.126.net%2F2024%2F1104%2Fed9d4a5bj00smf8to000jd000hs007dg.jpg&thumbnail=660x2147483647&quality=80&type=jpg"/><br/></p><p id="3558R4C3">图 1. 通过阿里云计算巢快速部署 NVIDIA NIM 架构图</p><p id="3558R4C5">(图片来源于阿里云,如您有任何疑问或需要使用本图片,请联系阿里云)</p><p id="3558R4C7"><strong>部署流程</strong></p><p id="3558R4C9">1. 参考 NVIDIA NIM 文档,生成<strong>NVIDIA NGC API Key</strong>,用于访问需要部署的模型镜像。以本文用到的 Llama-3-8B-Instruct 为例,可以通过<strong>NVIDIA NGC 目录</strong>来获取:</p><p id="3558R4CA">https://org.ngc.nvidia.com/setup/personal-keys</p><p id="3558R4CC">同时,请阅读并承诺遵守 Llama 模型的自定义可商用开源协议:</p><p id="3558R4CD">https://www.llama.com/llama-downloads/</p><p id="3558R4CF">2. 在阿里云计算巢服务目录中找到“基于 NVIDIA NIM 快速部署 LLM 模型推理服务”,并进入实例部署页面:</p><p id="3558R4CG">https://computenest.console.aliyun.com/service/detail/cn-hangzhou/service-8cd0757070b848a399e4</p><p id="3558R4CI">如下图所示,主要配置服务的基本信息和云上资源,以及第一步中获取的 NVIDIA NGC API Key,需要填写在下图相应位置。</p><p class="f_center"><img src="https://nimg.ws.126.net/?url=http%3A%2F%2Fdingyue.ws.126.net%2F2024%2F1104%2F11461b04j00smf8to000nd000hs009zg.jpg&thumbnail=660x2147483647&quality=80&type=jpg"/><br/></p><p id="3558R4CL">图 2. 在阿里云计算巢创建服务实例</p><p id="3558R4CN">(图片来源于阿里云,如您有任何疑问或需要使用本图片,请联系阿里云)</p><p id="3558R4CP">因为服务部署在阿里云 ACK 集群之上,这里也包含了 Kubernetes 配置:</p><p class="f_center"><img src="https://nimg.ws.126.net/?url=http%3A%2F%2Fdingyue.ws.126.net%2F2024%2F1104%2Fe188da0ej00smf8to000nd000hs00bcg.jpg&thumbnail=660x2147483647&quality=80&type=jpg"/><br/></p><p id="3558R4CS">图 3. 阿里云 ACK 集群上 Kubernetes 选项页面</p><p id="3558R4CU">(图片来源于阿里云,如您有任何疑问或需要使用本图片,请联系阿里云)</p><p id="3558R4D0">3. 按照页面提示完成所有配置之后,点击下一步:确认订单,在这里确认第 2 步配置的服务实例信息和价格预览。</p><p class="f_center"><img src="https://nimg.ws.126.net/?url=http%3A%2F%2Fdingyue.ws.126.net%2F2024%2F1104%2F8fa1b1e2j00smf8to000jd000hs0084g.jpg&thumbnail=660x2147483647&quality=80&type=jpg"/><br/></p><p id="3558R4D3">图 4. 确认服务实例信息和价格预览</p><p id="3558R4D5">(图片来源于阿里云,如您有任何疑问或需要使用本图片,请联系阿里云)</p><p id="3558R4D7">部署过程中,用户需要创建和访问阿里云资源,当阿里云账号属于 RAM 账号时,需要开通以下权限,页面上也有开通这些权限的入口。</p><p class="f_center"><img src="https://nimg.ws.126.net/?url=http%3A%2F%2Fdingyue.ws.126.net%2F2024%2F1104%2Fba89fdd5j00smf8to0013d000hs00asg.jpg&thumbnail=660x2147483647&quality=80&type=jpg"/><br/><br/></p><p id="3558R4DB">4. 点击立即创建,开始部署。过程中会涉及阿里云资源的创建、NIM 模型镜像的拉取等。拉取过程的日志,可通过”点击资源 tab-&gt; 找到 ACK 集群-&gt;页面左侧的工作负载-&gt;无状态”来查看。部署完成后,进入服务实例详情查看使用说明。通过 curl 发送 HTTP 请求访问推理服务,修改 content 字段,便可自定义和推理服务交互的内容。</p><p class="f_center"><img src="https://nimg.ws.126.net/?url=http%3A%2F%2Fdingyue.ws.126.net%2F2024%2F1104%2F36bec0c7j00smf8to000jd000hs00cbg.jpg&thumbnail=660x2147483647&quality=80&type=jpg"/><br/></p><p id="3558R4DE">图 5. 服务实例详情页面截图</p><p id="3558R4DG">(图片来源于阿里云,如您有任何疑问或需要使用本图片,请联系阿里云)</p><p id="3558R4DI"><strong>通过阿里云的云市场获取</strong></p><p id="3558R4DJ"><strong>NVIDIA AI Enterprise 使用该方案</strong></p><p id="3558R4DL">NVIDIA NIM 是 NVIDIA AI Enterprise 的一部分,正式使用时须获得 NVIDIA AI Enterprise 的许可证授权。现在,企业用户可以通过阿里云云市场获取 NVIDIA AI Enterprise 来使用该方案。阿里云市场提供了概念验证(PoC)测试服务和购买 NVIDIA AI Enterprise 许可证,共两个下单页面。</p><p><ul><li id="3558R4EF"><strong>PoC 测试服务</strong>(https://market.aliyun.com/products/201214006/cmgj00067281.html)</li></ul></p><p id="3558R4DN">提供 90 天 NVIDIA AI Enterprise PoC License,暨 90 天免费试用,而使用时须支付阿里云计算资源的费用。</p><p class="f_center"><img src="https://nimg.ws.126.net/?url=http%3A%2F%2Fdingyue.ws.126.net%2F2024%2F1104%2F8a981596j00smf8to000ad000hs004wg.jpg&thumbnail=660x2147483647&quality=80&type=jpg"/><br/><br/></p><p><ul><li id="3558R4EG">通过阿里云的云市场购买 NVIDIA AI Enterprise 许可证 (https://market.aliyun.com/products/201214006/cmfw00067311.html)</li></ul></p><p id="3558R4DR">该页面提供的信息仅供参考,用户需要通过该页面的“NVIDIA 服务咨询”钉钉来沟通采购,最终通过云市场官网推送下单链接获取 NVIDIA AI Enterprise 许可证。</p><p id="3558R4DT"><strong>总结</strong></p><p id="3558R4DV">本文介绍了通过阿里云计算巢快速部署 NVIDIA NIM 的方案收益和部署方式,该方案充分利用了 NIM 的安全与高性能的无缝 AI 推理功能,以及计算巢的软件一站式上云和交付能力,从而打造极致弹性、高性能、可实时观测的云上 LLM 推理服务。更多 LLM 上云部署参考示例请查看<strong>NVIDIA NGC 目录</strong>:</p><p id="3558R4E0">https://catalog.ngc.nvidia.com/?filters=nvidia_nim%7CNVIDIA+NIM%7Cnimmcro_nvidia_nim%2CresourceType%7CContainer%7Ccontainer</p><p id="3558R4E2">欢迎大家体验和试用。</p><p id="3558R4E4"><strong>作者信息</strong></p><p class="f_center"><img src="https://nimg.ws.126.net/?url=http%3A%2F%2Fdingyue.ws.126.net%2F2024%2F1104%2F82b17a50j00smf8to000qd000hs00hsg.jpg&thumbnail=660x2147483647&quality=80&type=jpg"/><br/><br/></p><p id="3558R4E7"><strong>毛亦姝</strong></p><p id="3558R4E9">NVIDIA 解决方案架构师,主要负责生成式 AI 模型的训练、推理在云上的落地,多年互联网算法工作经验。</p>

讯享网
小讯
上一篇 2025-04-30 18:48
下一篇 2025-05-17 21:26

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/151182.html