2026年GTC 2026 前夜:AI 正在成为新的基础设施

GTC 2026 前夜:AI 正在成为新的基础设施下周 全球 AI 行业最重要的技术大会之一 NVIDIA GTC 2026 将在美国圣何塞举行 对很多人来说 GTC 只是一个 GPU 技术大会 但如果你持续关注过去几年 AI 行业的发展 就会发现一个很有意思的现象 很多 AI 基础设施的重要叙事 都是在 GTC 上逐渐形成的 从 CUDA DGX 到 AI Factory 再到最近 Jensen Huang 提出的 AI

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



下周,全球 AI 行业最重要的技术大会之一 NVIDIA GTC 2026 将在美国圣何塞举行。

对很多人来说,GTC 只是一个 GPU 技术大会。但如果你持续关注过去几年 AI 行业的发展,就会发现一个很有意思的现象:

很多 AI 基础设施的重要叙事,都是在 GTC 上逐渐形成的。

从 CUDA、DGX,到 AI Factory,再到最近 Jensen Huang 提出的 AI Five-Layer Cake,NVIDIA 正在不断试图重新定义 AI 时代的计算基础设施。

这也是为什么很多人把 GTC 称为:

AI 的“Woodstock”。

图 1: NVIDIA GTC Conference
图 1: NVIDIA GTC Conference

今年的 GTC(3 月 16 日—19 日)预计会覆盖 AI stack 的各个层面,包括:

  • AI 芯片
  • AI 数据中心
  • AI Agent
  • 机器人
  • 推理计算

根据 NVIDIA 官方博客 的介绍,今年的 keynote 将重点讨论 从芯片到应用的完整 AI stack

如果把这些信号放在一起,其实能看到一个更大的趋势:

AI 正在从“应用技术”,变成“基础设施”。

从更长的时间尺度来看,人类历史上的技术革命,本质上都是基础设施的革命。

通常我们把工业革命划分为四次。

在下表中,可以看到每次工业革命对应的基础设施:

工业革命基础设施蒸汽革命蒸汽机电气革命电网数字革命计算机互联网时代网络
表 1: 工业革命与基础设施对应关系

蒸汽机让人类第一次能够大规模利用机械动力。生产不再依赖人力或动物,而是依赖机器。

电力改变的不只是动力来源,还改变了生产组织方式。流水线、规模化制造、现代工业体系,都建立在电网基础之上。

计算机让信息可以被数字化处理。软件成为生产工具。

互联网把所有计算机连接在一起。云计算把计算资源变成基础设施。而 AI,则让机器开始具备一定程度的“认知能力”。

如果观察这些工业革命,会发现一个规律:

每一次工业革命都会产生一种新的 通用基础设施(General Purpose Infrastructure)

而 AI,很可能会成为下一代基础设施。

NVIDIA 在最近的文章中甚至直接提出:

AI is essential infrastructure, like electricity and the internet.

换句话说:

AI 不再只是一个应用技术,而是一个 新的生产要素

最近 Jensen Huang 提出了一个非常有意思的概念:AI Five-Layer Cake

图 2: AI Five Layer Cake(图片来源 <a href=NVIDIA)’ data-caption=‘图 2: AI Five Layer Cake(图片来源 NVIDIA)’ loading=lazy decoding=async class=image-loading onload=‘this.classList.remove(“image-loading”),this.classList.add(“image-loaded”)’ onerror=‘handleImageError(this),this.classList.remove(“image-loading”)’>
图 2: AI Five Layer Cake(图片来源 NVIDIA)

AI 被拆解为五个层次:

  1. Energy
  2. Chips
  3. AI Infrastructure
  4. Models
  5. Applications

这个模型其实说明了一件事情:

AI 是一个完整的产业体系。

Jensen Huang 在 Davos 甚至把 AI 描述为:

“人类历史上最大规模的基础设施建设之一。”

今年的 GTC 预计会释放几个重要方向。

过去 AI 的重点是训练。但未来 AI 的主要负载很可能是 推理(Inference)

分析师预计,到 2030 年 AI 数据中心市场中 75% 的算力需求来自推理

过去 AI 的模式是:

而 Agent 的模式则更为复杂:

下方流程图展示了 Agent 模式下的主要交互路径:

图 3: Agentic AI 交互流程
图 3: Agentic AI 交互流程

AI 不再只是回答问题,而是 执行任务

最近有媒体报道称 NVIDIA 可能会推出一个新的 Agent 平台:NemoClaw,目标是帮助企业部署 AI Agent。

如果这个项目真的发布,那意味着 NVIDIA 的 stack 会变成如下结构:

图 4: NVIDIA Agent 平台架构
图 4: NVIDIA Agent 平台架构

这其实就是一个完整的 AI stack。

Agent 的出现带来了新的计算负载问题。

过去 AI workload 主要是:

  • Training
  • Inference

但 Agent 带来第三种 workload:

Agent Workloads

下图展示了 Agent 相关的多样化负载类型:

图 5: Agent Workloads 结构
图 5: Agent Workloads 结构

这种 workload 的特点是 高度碎片化。GPU 不再是被长时间占用,而是大量小请求。这对基础设施提出了新的挑战。

过去几年,我一直在思考一个问题:

什么是 AI 原生基础设施?

它显然不只是“带 GPU 的 Kubernetes”。我更倾向于认为它需要具备几个特征。

云计算时代,CPU 是核心资源。AI 时代,GPU 是核心资源

现实世界的 AI 芯片并不只有 NVIDIA:

  • NVIDIA
  • 华为昇腾
  • 寒武纪
  • 沐曦
  • 摩尔线程
  • 其他专用 AI 芯片

未来的 AI 基础设施必须能够管理 异构算力

GPU 是一种非常昂贵的资源。如果不能共享,利用率会非常低。这也是为什么 GPU virtualization 和 slicing 变得越来越重要。

AI 调度不仅包括传统的 CPU、Memory,还包括:

结合上述趋势,未来 AI stack 可能会呈现如下结构:

图 6: AI 技术栈演进
图 6: AI 技术栈演进

这个结构与 NVIDIA 的 Five-Layer Cake 十分接近。

综合 GTC、AI Factory、Agent、AI Five-Layer Cake 等信号,可以看到一个非常明显的趋势:

AI 正在重写计算基础设施。

未来的竞争很可能不只是“谁拥有最好的模型”,而是:

谁拥有最好的 AI Infrastructure。

就像过去几十年:

  • 电力决定工业能力
  • 互联网决定信息能力
  • 云计算决定软件能力

未来可能是:

AI Infrastructure 决定智能能力。

如果把时间尺度再拉长一点,我们或许正处在一个新的历史阶段。

AI 不再只是一个技术工具。它正在变成 新的基础设施

就像:

  • 电力
  • 互联网
  • 云计算

一样。

而 AI 原生基础设施,很可能会成为未来十年最重要的技术方向之一。

小讯
上一篇 2026-03-16 09:56
下一篇 2026-03-16 09:54

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/239616.html