黄仁勋的最新野心,已经是AGI时代大一统

2025-01-07 18:19:42 来源: 观察者网

  “请问有椅子可以让我坐一会儿吗?”

  手持一块硕大“盾牌”,摆出美国队长的pose之后,年过六旬的英伟达创始人黄仁勋似乎有些体力不支了。

  当地时间1月6日晚,黄仁勋在拉斯维加斯的CES 2025上带来开幕演讲。性能翻倍的5090、性能与4090相当却只卖三分之一价格的5070……英伟达新一代显卡的发布足以让游戏玩家兴奋,不过跟这个耗尽老黄体力的大家伙相比,就是小巫见大巫了——

  这就是巨型芯片系统NVLink72。

  黄仁勋手里的“盾牌”,其实只是NVLink72的缩小模型。真正的NVLink72由72块Blackwell GPU构成,整体重量达到1.5吨,据称算力超过世界上最大、最快的超级计算机。

  黄仁勋的目标,是满足世界上所有数据中心的算力需求。

  这应该不仅仅指现有的算力需求,黄仁勋还想要创造更多的需求。在演讲中,黄仁勋还正式介绍了其世界基础模型NVIDIA Cosmos和语言基础模型NVIDIA Llama Nemotron。作为一个物理模型,Cosmos能够生成海量仿真物理数据,帮助自动驾驶和机器人企业训练自己的算法。

  并且,Cosmos是一个开源模型。作为算力基础设施提供者的英伟达,正试图把模型也变成标准化的基础设施,而使用模型的企业也会与英伟达算力深度绑定。

  黄仁勋的目光,已经投向AGI时代的大一统。

  “满足全球数据中心需求”

  早在去年,英伟达就发布过Blackwell架构的超级芯片系统GB200,由两颗B200 GPU、一颗Grace CPU构成。这个思路简单来说,就是一块芯片做不到的事,就把两块芯片叠加起来。

  此次发布的NVLink36和NVLink72更是把这个思路发挥到极致。

  NVLink72包含72个Blackwell GPU,144个芯片,总共有130万亿个晶体管,2592个CPU核心,并以HBM内存相连。

  黄仁勋表示,一个NVLink72芯片的的AI浮点运算性能是1.4exaflops,比世界上最大、最快的超级计算机还要大。

  除了算力巨大,Blackwell架构的芯片与上一代相比,每瓦性能提高了四倍,每美元性能提高了三倍。

  黄仁勋指出,目前大模型的token生成速度为每秒20到30个,与人类阅读速度相当。但未来,GPT-O1、O3和Gemini Pro等新模型能够进行自我对话和反思,因此token的生成速度将大幅提高,因此必须大幅降低算力成本,才能让数据中心盈利,也就是创建NVLink的原因。

  黄仁勋表示,Blackwell目前已在45家工厂全面投产,由约15家计算机制造商提供200多种不同配置的系统,采用液冷、风冷等多种冷却方式,并支持多种CPU和NVLink配置,以满足全球数据中心的需求。

  “机器人的ChatGPT时刻”

  英伟达另一个意义重大的发布是Cosmos。

  Cosmos的含义是“宇宙”,体现出英伟达对这个世界模型寄予的极大期望。

  其实去年年中,Cosmos项目就已经引起外界注意。为了获取现实世界数据,据说英伟达从YouTube及其他视频平台大规模下载视频内容作为训练数据喂给Cosmos,引发了一些版权争议。谷歌和Netflix公开声明,禁止任何未经授权的内容抓取行为。

  Cosmos究竟扒了多少数据?这次黄仁勋给出了答案——2000万小时的视频训练。

  黄仁勋介绍,Cosmos优先考虑了自动驾驶和机器人行业的需求,开发者可以使用NVIDIA Omniverse构建基于物理的、地理空间精确的场景,然后将Omniverse渲染输出到Cosmos,后者生成逼真的、基于物理的合成数据,涵盖不同的物体、环境以及天气、时间或极端情况等条件。

  相较于语言模型可以使用全网语料训练,自动驾驶和机器人的训练需要来自真实世界的训练素材,获取成本高昂,成为具身智能发展的最大障碍。为解决真实数据难以获得的问题,很多企业都转向了使用机器生成的仿真数据进行训练。

  而Cosmos有望为大量无力自己生产仿真数据的企业,提供一个廉价方案。

  作为自动驾驶领军者的特斯拉,会不会感受到巨大的威胁?

  X平台知名博主Sawyer Merritt对此评论说,Cosmos看上去是为传统汽车制造商准备的,它们的现实世界数据收集几乎为零,落后特斯拉多年,合成数据有望解决这一问题,但未必能完全解决,因为合成驾驶数据有点像使用 ChatGPT,数据质量未必完全可靠。

  马斯克转发了这条博文,并评论说——正确(correct)。

  但黄仁勋已经发出了宣言:希望开源的Cosmos能像LLAMA 3改变企业AI一样,改变机器人和工业AI领域,通用机器人即将迎来“ChatGPT时刻”。

  展示朋友圈

  除了秀技术之外,黄仁勋演讲中的另一个重要部分,是展示自己的朋友圈。

  在介绍Cosmos模型时,黄仁勋在台上一口气请出了14台不同品牌的机器人产品,其中6台来自中国,分别是宇树、智元、星动纪元、银河通用、傅利叶和小鹏的产品。

  比亚迪002594)、理想、小米、极氪等中国新能源车企,将搭载英伟达下一代智能驾驶芯片Thor。丰田则将与英伟达合作开发下一代自动驾驶汽车。

  成熟的开发生态,一向是英伟达除了硬件之外同样重要的护城河。通过开源Cosmos和 Llama Nemotron两个模型,无论英伟达能否真正威胁到特斯拉和OpenAI的领先地位,它都有助于“技术平权”,让更多企业快速进入AI领域,从而极大扩展自己的用户规模。

  借助强悍的硬件性能和面向物理世界的开源基础设施,英伟达的野心不言而喻——要在AGI时代继续强化自己的算力垄断。

关注同花顺财经(ths518),获取更多机会

0

+1
  • 海得控制
  • 雄韬股份
  • 太辰光
  • 顺钠股份
  • 中恒电气
  • 华塑科技
  • 海鸥股份
  • 寒武纪
  • 代码|股票名称 最新 涨跌幅