英伟达首席执行官黄仁勋的每次主题演讲都像一场马拉松。这是一场长达2.5小时的产品发布和合作伙伴关系展示,旨在测试最铁杆硅谷粉丝的极限。演讲节奏快、信息量大,坦率地说,需要大量时间消化。
但如果你在两小时左右的时候走神了,就会错过一个关键故事。
黄仁勋花了大约两分钟宣布英伟达智能体工具包。正如我们上周所写,它是”一套旨在增强人工智能智能体能力的开源工具”的一部分。
然而,TheCUBE研究合作伙伴Raphaelle d’Ornano认为,这个看似次要的公告值得比现在更多的关注。因此本周,她发布了最新的深度分析,探讨她认为智能体工具包揭示了英伟达更大的野心和战略。
重现CUDA战略手册
这不是一个新策略,而是英伟达的经典强势举措。2006年,其CUDA软件将图形处理单元从”游戏玩具”转变为现代AI的计算支柱。这是一个长期投注,花了10年时间才获得回报,创造了竞争对手至今仍在努力跨越的护城河。
现在,黄仁勋正在重现CUDA战略手册,但他向堆栈上层移动了一层。
智能体工具包不是要拥有”智能”(AI模型),而是要拥有每个企业智能体下的基础设施。无论你运行GPT-4、Claude还是Llama,英伟达都想成为管道。不是大脑——是基质。
分解”智能体系统”
Raphaelle将其分解为四个关键组件,它们作为统一的高性能系统运行:
Nemotron:这不是”前沿模型”杀手。它不试图在推理上超越Claude。这是一个精简、高效的开源模型家族,针对繁重工作进行了优化。它以一小部分成本处理80%的常规企业任务。
OpenShell:这是”房间里的成年人”。它是一个开源运行时,执行基于策略的安全和隐私护栏。这是企业在让智能体在其数据上运行之前必须具备的治理层。
AI-Q蓝图:这是连接组织。我们谈论的是比传统方法快15倍的检索管道。它具有混合路由系统,将”重型工作”发送到前沿模型,将”常规”任务发送到Nemotron,将查询成本削减50%以上。
NemoClaw:”简易按钮”。它将整个堆栈——框架、模型和安全——打包成一个单一的、可部署的企业级单元。
生态系统就是护城河
这不仅仅是产品发布,而是实时形成的生态系统。软件即服务世界正在进行控制权的”圈地运动”,SaaS公司正在选择英伟达作为他们的基础。Salesforce正在此堆栈上部署Agentforce;SAP正在连接Joule;ServiceNow正在整合其Apriel模型。从Adobe到Palantir Technologies,重量级企业正在用代码投票。
编排紧张局势
D’Ornano将真正的战斗框架化为两种架构之间的对决:
架构A:Anthropic和OpenAI等模型提供商编排一切。SaaS现任者成为应用程序编程接口端点。英伟达销售GPU但在芯片之上什么都捕获不到。
架构B:SaaS现任者在英伟达基础设施上编排,使用其上下文护城河进行差异化,而英伟达捕获硬件层和其下的软件基础设施层。
智能体工具包是英伟达让架构B获胜的策略。
英伟达押注架构B,但有一个问题:编排税。在复杂的15步智能体工作流中,每步95%准确率的模型超过一半时间失败(46%成功)。在99%时,成功率跳跃到86%。
目前,只有Claude和GPT等前沿模型在高级规划方面达到这些”刚刚好”的数字。这给实验室带来了巨大的定价权力。
底线
她识别出的紧张关系在这里。英伟达自己的AI-Q设计承认,前沿编排任务仍需要Claude或GPT级别的质量。在智能体工作流中,模型质量不会优雅地降级。在15步工作流中每步达到95%准确率的模型仅46%的时间提供正确结果。在99%时,这跳跃到86%。
编排步骤是前沿实验室掌握定价权的地方。这是规划、错误恢复和多步协调发生的地方。如果这个差距不缩小,无论谁拥有运行时,模型提供商都会通过后门成为事实上的编排者。
反驳论点是前沿差距不是固定的。开源模型在不到两年时间里在许多任务上从”巨大”转变为”可忽略”。蒸馏技术正在加速这种收敛。Nemotron联盟——包括LangChain、Cursor和Mistral——专门针对智能体任务进行优化。
AI领域的”游客”可能错过了主题演讲的那两分钟,但企业参与者没有。英伟达正在悄悄巩固其作为智能体时代不可或缺基础的地位。
它不仅赢得了芯片战争,还重新定义了整个AI操作系统。
Q&A
Q1:英伟达智能体工具包是什么?它有什么作用?
A:英伟达智能体工具包是一套开源工具,旨在增强人工智能智能体的能力。它不是要拥有”智能”(AI模型),而是要拥有每个企业智能体下的基础设施,成为所有AI模型运行的底层管道。
Q2:英伟达如何重现CUDA战略?
A:英伟达正在重现2006年CUDA的成功战略,但向堆栈上层移动了一层。当年CUDA将GPU从”游戏玩具”转变为AI计算支柱,现在智能体工具包要成为智能体时代的基础设施标准。
Q3:为什么说编排步骤是关键问题?
A:在复杂的15步智能体工作流中,模型准确率直接影响成功率。95%准确率的模型只有46%成功率,99%准确率才能达到86%成功率。目前只有Claude和GPT等前沿模型能达到高级规划所需的质量标准。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/248049.html