中国驻美大使谢锋:人工智能不能野蛮生长跑马圈地
2026-06-22
2026-06-25 0
相关内容请参考“DeepSeek v4:国产化训练从0到1里程碑,战略意义大于性能意义”,AI、芯片、半导体、大模型等“97个技术专栏”,请参考智能计算芯知识。
当AI正式进入智能体(Agent)时代,大模型之间的交互、长上下文记忆、混合专家(MoE)、强化学习已经把传统算力集群彻底榨干。英伟达没有选择升级显卡,而是直接重新定义了整座 AI 工厂——Vera Rubin Pod来了。
这不是一台服务器,不是一个机架,而是一套从芯片到电网、从计算到存储、从训练到推理完全重构的 POD 级 AI 超级计算机。它的目标只有一个:把每一度电,都变成 AI 的 token;把每一颗芯片,都跑在智能体的极致效率里。
它是英伟达用第三代 MGX 模块化架构做的一套 “超级 AI 一体机”。5 类专用机架,各司其职7 类芯片协同,全链路打通40 个机架组成一整座 “AI 工厂”算力高达
60 EFLOPS
10PB/s
简单说:以前你买 GPU;现在,英伟达直接卖给你一整套可以立刻量产智能体 AI 的超级基础设施。
Vera Rubin Pod 最恐怖的地方,是它把 AI 工作流拆成 5 个专属机架,各自专精、全线打通。
单机架塞进72 颗 Rubin GPU + 36 颗 Vera CPU,用第六代 NVLink 铜背板硬连在一起,相当于一整个机架变成一颗巨型 GPU。
4 倍
10 倍
3.6TB/s
260TB/s
英伟达把 Groq 的 LPU 直接做成机架级引擎:
低延迟、大上下文
35 倍它解决的是:智能体必须快、必须稳、不能等。
智能体要试错、要模拟、要决策,全靠 CPU 沙箱。
256 颗 Vera CPU
22500 个并发沙箱
2 倍
这是全球第一个为 AI 设计的存储机架。
5 倍
5 倍
以后大模型再长的上下文,都不会爆显存。
全机架用CPO 共封装光学、Spectrum-X、Quantum-X800 打通:
零抖动它保证:所有机架像一台机器一样同步。
Vera Rubin Pod 强,不是强在堆芯片,而是强在工程设计。
MGX 用铜质背板取代几千根线缆,计算托盘即插即用。
20 倍,单宽机架,运输部署极简单
支持45℃温水直接冷,大部分地区可以无压缩机自然冷却。
三层电源黑科技:
这套超算是真正能线性扩展的:
NVL72:单机架 72 卡Ultra NVL576:8 机架拼成 576 卡统一域Kyber NVL1152:下一代 1152 卡超级集群
从实验室到千卡超算,一套架构打通。
英伟达怕你不会搭,直接给了DSX 全栈参考平台:
这就是:你买的不是超算,是一整套赚钱的 AI 工厂。
Vera Rubin Pod 的发布,标志着一个时代结束:以后不再比谁显卡多,而是比谁的 AI 工厂更强。
它为智能体 AI 量身定做:低延迟、高吞吐、高能效、全链路、可扩展、可量产。
这就是英伟达的终极答案:不跟你拼芯片,我直接定义下一代 AI 基础设施。
免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。
温馨提示:AI、芯片、半导体、大模型等“97个技术专栏”,请参考智能计算芯知识。