下周,全球 AI 行业最重要的技术大会之一 NVIDIA GTC 2026 将在美国圣何塞举行。
对很多人来说,GTC 只是一个 GPU 技术大会。但如果你持续关注过去几年 AI 行业的发展,就会发现一个很有意思的现象:
很多 AI 基础设施的重要叙事,都是在 GTC 上逐渐形成的。
从 CUDA、DGX,到 AI Factory,再到最近 Jensen Huang 提出的 AI Five-Layer Cake,NVIDIA 正在不断试图重新定义 AI 时代的计算基础设施。
这也是为什么很多人把 GTC 称为:
AI 的“Woodstock”。
今年的 GTC(3 月 16 日—19 日)预计会覆盖 AI stack 的各个层面,包括:
- AI 芯片
- AI 数据中心
- AI Agent
- 机器人
- 推理计算
根据 NVIDIA 官方博客 的介绍,今年的 keynote 将重点讨论 从芯片到应用的完整 AI stack。
如果把这些信号放在一起,其实能看到一个更大的趋势:
AI 正在从“应用技术”,变成“基础设施”。
从更长的时间尺度来看,人类历史上的技术革命,本质上都是基础设施的革命。
通常我们把工业革命划分为四次。
在下表中,可以看到每次工业革命对应的基础设施:
蒸汽机让人类第一次能够大规模利用机械动力。生产不再依赖人力或动物,而是依赖机器。
电力改变的不只是动力来源,还改变了生产组织方式。流水线、规模化制造、现代工业体系,都建立在电网基础之上。
计算机让信息可以被数字化处理。软件成为生产工具。
互联网把所有计算机连接在一起。云计算把计算资源变成基础设施。而 AI,则让机器开始具备一定程度的“认知能力”。
如果观察这些工业革命,会发现一个规律:
每一次工业革命都会产生一种新的 通用基础设施(General Purpose Infrastructure)。
而 AI,很可能会成为下一代基础设施。
NVIDIA 在最近的文章中甚至直接提出:
AI is essential infrastructure, like electricity and the internet.
换句话说:
AI 不再只是一个应用技术,而是一个 新的生产要素。
最近 Jensen Huang 提出了一个非常有意思的概念:AI Five-Layer Cake。
NVIDIA)’ data-caption=‘图 2: AI Five Layer Cake(图片来源 NVIDIA)’ loading=lazy decoding=async class=image-loading onload=‘this.classList.remove(“image-loading”),this.classList.add(“image-loaded”)’ onerror=‘handleImageError(this),this.classList.remove(“image-loading”)’>AI 被拆解为五个层次:
- Energy
- Chips
- AI Infrastructure
- Models
- Applications
这个模型其实说明了一件事情:
AI 是一个完整的产业体系。
Jensen Huang 在 Davos 甚至把 AI 描述为:
“人类历史上最大规模的基础设施建设之一。”
今年的 GTC 预计会释放几个重要方向。
过去 AI 的重点是训练。但未来 AI 的主要负载很可能是 推理(Inference)。
分析师预计,到 2030 年 AI 数据中心市场中 75% 的算力需求来自推理。
过去 AI 的模式是:
而 Agent 的模式则更为复杂:
下方流程图展示了 Agent 模式下的主要交互路径:
AI 不再只是回答问题,而是 执行任务。
最近有媒体报道称 NVIDIA 可能会推出一个新的 Agent 平台:NemoClaw,目标是帮助企业部署 AI Agent。
如果这个项目真的发布,那意味着 NVIDIA 的 stack 会变成如下结构:
这其实就是一个完整的 AI stack。
Agent 的出现带来了新的计算负载问题。
过去 AI workload 主要是:
- Training
- Inference
但 Agent 带来第三种 workload:
Agent Workloads
下图展示了 Agent 相关的多样化负载类型:
这种 workload 的特点是 高度碎片化。GPU 不再是被长时间占用,而是大量小请求。这对基础设施提出了新的挑战。
过去几年,我一直在思考一个问题:
什么是 AI 原生基础设施?
它显然不只是“带 GPU 的 Kubernetes”。我更倾向于认为它需要具备几个特征。
云计算时代,CPU 是核心资源。AI 时代,GPU 是核心资源。
现实世界的 AI 芯片并不只有 NVIDIA:
- NVIDIA
- 华为昇腾
- 寒武纪
- 沐曦
- 摩尔线程
- 其他专用 AI 芯片
未来的 AI 基础设施必须能够管理 异构算力。
GPU 是一种非常昂贵的资源。如果不能共享,利用率会非常低。这也是为什么 GPU virtualization 和 slicing 变得越来越重要。
AI 调度不仅包括传统的 CPU、Memory,还包括:
结合上述趋势,未来 AI stack 可能会呈现如下结构:
这个结构与 NVIDIA 的 Five-Layer Cake 十分接近。
综合 GTC、AI Factory、Agent、AI Five-Layer Cake 等信号,可以看到一个非常明显的趋势:
AI 正在重写计算基础设施。
未来的竞争很可能不只是“谁拥有最好的模型”,而是:
谁拥有最好的 AI Infrastructure。
就像过去几十年:
- 电力决定工业能力
- 互联网决定信息能力
- 云计算决定软件能力
未来可能是:
AI Infrastructure 决定智能能力。
如果把时间尺度再拉长一点,我们或许正处在一个新的历史阶段。
AI 不再只是一个技术工具。它正在变成 新的基础设施。
就像:
- 电力
- 互联网
- 云计算
一样。
而 AI 原生基础设施,很可能会成为未来十年最重要的技术方向之一。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/239616.html