黄仁勋公布芯片架构路线图,英伟达拥抱AI推理新纪元

2025-03-19 17:39:22 来源: 银柿财经

  英伟达后续两代芯片架构Rubin、Feynman或分别于2026年、2028年问世。

  GTC大会素有“AI届春晚”的外号,而在当地时间3月18日举行的GTC 2025的开幕主题演讲中,英伟达(NVDA.US)创始人黄仁勋主动玩起了“梗”。他说,“GTC大会被称为AI届的‘超级碗’,但唯一的区别是,在这里AI会让每个人成为赢家。”

  在这场大会上,黄仁勋再次重申对“Scaling law”(扩展定律)的信仰,称推理和代理AI使计算需求激增,并基于此将在今年下半年推出新品Blackwell Ultra,性能是前代产品的1.5倍。

  “全世界几乎都对Scaling Law看走眼”

  与以往GTC开场即抛出“硬通货”不同,今年GTC开场,黄仁勋用约40分钟解读英伟达在Agentic AI时代的立身之本——愈发高效处理tokens(词元),而tokens也被视为AI的语言与货币。

  “AI真正进入大众视野仅仅过去十年而已。”黄仁勋回顾了AI已经历的三代技术范式的转移。最早从perception AI(感知AI)——计算机视觉和语音识别开始,然后是Generative AI(生成式AI),再到当下热门的Agentic AI(代理AI),未来是会影响世界的Physical AI(物理AI)。

  过去两三年,技术范式进入Agentic AI,出现人工智能的根本性飞跃。Agentic AI的基础是推理,其具备主动性,能感知并理解当前语境的上下文,能思考如何回答并解决问题,能制定并执行计划。而在Agentic AI之后,下一波浪潮正在发生,机器人领域的AI进展由Physical AI推动,是理解物理世界、三维世界的AI——这种理解能力将开辟AI的新纪元,使智能机器人变得可行。

  黄仁勋表示,从本质上说,每个阶段的AI,都涉及三大根本问题。第一,如何解决数据问题。因为AI是一门数据驱动的数据科学,需要数字化的经验来学习、获取知识。第二,如何在没有人工参与的情况下进行模型训练。因为人工干预是有极限的,而人们想要AI能以超越人类的速度来实时学习,而且规模足够大到人类无法企及。第三,如何进行扩展(Scale)。如何使得人们提供越多的算力、数据等资源,AI模型就变得越聪明,这被称为“Scaling law”。

  Scaling Law背后蕴含的逻辑是“大力出奇迹”。而在去年,AI界掀起Scaling Law是否失效的讨论,引起市场对算力需求不再坚挺的担忧,而黄仁勋在演讲中提出了截然相反的观点。“针对Scaling law放缓,过去一年几乎全世界都看走眼了。”黄仁勋谈到,由于Agentic AI及推理的出现,如今所需的计算量比一年前的预期至少高出100倍。AI的计算需求及其扩展定律其实更具韧性,甚至加速。

  由此可以预见,AI所生成的token数量会急剧增多。黄仁勋表示,AI的底层技术本质仍是根据上一个token来预测下一个token。不同的是,现在“下一个token”对应的是推理的某个步骤——AI生成第一步的token,然后把这一步的输出再次输入给AI,用来生成后续推理。这样一来,AI不再只是一字一句地往外“吐”token,而是生成一大段文字来表示推理的步骤,最终产生的token量会大大增加。

  “如果我们想让模型具备交互性、实时性,不因它‘思考’太久而让人失去耐心,就要把计算速度提高10倍。”黄仁勋表示,伴随着token、速度双双增加,推理所需的算力远超以往。

  与今年2月业绩会上的表述一致,黄仁勋对英伟达未来业务增长表示乐观。演讲中,黄仁勋提到推理与强化学习的需求推动AI计算的需求,并用Hopper在四大CSP(云服务提供商)中的出货量来解读AI基础设施的激增,他预计数据中心建设将会达到万亿美元规模。

  公布芯片架构路线图,开启AI推理新纪元

  本次主题演讲中,黄仁勋宣告了新产品发布,预告了接下来两代AI芯片架构进展,并公布了英伟达接下来的芯片路线图。

  黄仁勋表示,英伟达将推出新品Blackwell Ultra芯片,在今年下半年出货。下一次芯片升级则是在2026年下半年,预计将推出下一代AI芯片架构“Rubin”,该架构以“证实暗物质存在”的女性科学先驱Vera Rubin来命名,而Rubin Ultra将于2027年下半年推出。

  据介绍,英伟达将于今年下半年推出的新品Blackwell Ultra基于公司一年前推出的Blackwell架构,包含GB300 NVL72机架级解决方案和NVIDIA HGX B300 NVL16系统,预计将比前代产品GB200 NVL72提供1.5倍的AI性能,而与使用NVIDIA Hopper构建的工厂相比,Blackwell的AI工厂收入机会增加了50倍。

  据介绍,GB300 NVL72机架级解决方案集成了72个Blackwell Ultra GPU和36个基于Arm Neoverse架构的NVIDIA Grace CPU,形成一个庞大的单体GPU,专为测试时的扩展推理而打造。通过GB300 NVL72,AI模型可以利用平台增强的算力,探索不同的解决方案,并将复杂请求拆解为多个步骤,从而实现更高质量的响应。

  将在2026年下半年问世的英伟达下一代架构Rubin则是一个全新架构,“只保留现有的机箱和底层基础设施。”黄仁勋表示,Rubin和定制CPU Vera 对标现在的Blackwell和Grace CPU。据介绍,Vera Rubin由Rubin GPU和Vera CPU组成,后者拥有88个定制Arm核心、176个线程。而Rubin Ultra系统由Rubin Ultra GPU和Vera CPU组成。Rubin Ultra由4块掩模尺寸的GPU组成,FP4峰值推理能力可达100PFLOPS。

  同时,黄仁勋还在大会现场展示了两个机架级解决方案——Vera Rubin NVL144和Rubin Ultra NVL576。Vera Rubin NVL144的FP4推理算力可达到3.6EFLOPS,FP8训练算力可达到1.2EFLOPS,是新发布的GB300 NVL72的3.3倍。Rubin Ultra NVL576的FP4峰值推理算力高达15EFLOPS,FP8训练算力达到5EFLOPS,是GB300 NVL72的14倍。

  同时黄仁勋还公布了英伟达接下来的芯片路线图,在Rubin之后的下一代芯片的架构已经被命名为Feynman,将于2028年问世,该架构以著名理论物理学家Richard Feynman命名。

  在介绍完英伟达完整路线图后,黄仁勋表示,英伟达的节奏是“一年一次”,每年都会带来一次新架构,每两年一次大的产品线迭代,每次都实现数量级提升,“我们会分步承担硅片、网络、机箱等方面的风险,从而推动整个行业不断前进,朝着这些不可思议的技术迈进。”

  机器人、自动驾驶……AI迈进千行百业

  除了公布芯片架构路线图,黄仁勋还在演讲中发布了多项产品,并公布多个合作伙伴。他表示,AI将会进入各行各业,涉及机器人、自动驾驶汽车、工厂和无线网络领域。

  在汽车领域,黄仁勋表示,英伟达与汽车行业的合作方式十分灵活,面向车企需求,提供三种计算机:训练计算机、仿真计算机、自动驾驶计算机,以及基于其的整套软件栈、模型和算法。

  同时,黄仁勋还宣布了英伟达与通用汽车在自动驾驶领域的合作。通用汽车将利用英伟达的平台构建人工智能系统,为工厂规划训练人工智能制造模型;并使用英伟达的人工智能芯片和软件开发未来的自动驾驶技术。此外,英伟达推出用于自动驾驶汽车的综合安全系统Halos,涵盖芯片和软件、工具等。

  在机器人领域,黄仁勋宣布推出全球首款开源人形机器人功能模型GR00T N1,并发布了Simulation Frameworks,用于加速机器人开发。此外,黄仁勋透露,英伟达、谷歌DeepMind和迪士尼合作开发了一个用于机器人模拟的Newton开源物理引擎。

  “现在已经是机器人时代了,机器人能与物理世界交互,执行纯数字世界无法实现的工作。”黄仁勋进一步表示,到21世纪20年代末,全球至少有5000万劳动力短缺,物理AI和机器人正在飞速发展,可能会成为规模最大的产业。

关注同花顺财经(ths518),获取更多机会 返回首页举报 >

385

+1
advert
advert
advert
advert

07:02

当地时间2025年3月22日,中共中央政治局委员、外交部长王毅在东京同日本外相岩屋毅、韩国外长赵兑烈共同出席第11次中日韩外长会。王毅表示,中日韩合作是东亚地区基础最深厚、机制化程度最高、发展潜力最大的合作架构之一。三国合作启动20多年来取得积极成果,不仅惠及三国人民和各自发展,也推动了地区稳定与经济一体化进程。在三方共同努力下,第九次中日韩领导人会议确定的“六大关键领域”合作迈出新步伐。事实证明,中日韩合作越实,三国抵御风险的能力就越强,赋能发展的基础就越牢,促进人民相知相亲也就越见成效。 王毅说,今年是联合国成立80周年,也是中国人民抗日战争暨世界反法西斯战争胜利80周年。真诚反省历史才能切实开创未来。三国应重温“正视历史、面向未来”的共识,坚守合作初心,推动中日韩合作发挥“1+1+1>3”的作用,造福三国、地区和世界。王毅强调,有风有雨是常态,风雨无阻是心态。三国合作要行稳致远,必须同双边关系相互促进、良性循环。尤其要尊重彼此的核心利益,管控好矛盾分歧,在维护良好稳定的双边关系基础上,不断积累共识、培育动能、深化合作、提升水平。中方愿同日韩一道,推动中日韩合作在新形势下提质升级,更加成熟、更加稳定、更富韧性。(第一财经)

05:47

金融监管总局近日发布《商业银行代理销售业务管理办法》(以下简称《办法》),有关司局负责人就《办法》相关问题回答了记者的提问。有关司局负责人指出,近年来,商业银行代销业务快速发展,代销产品数量和类型日益丰富,客户覆盖面日益广泛。在相关监管制度不断压实金融产品发行人、管理人责任的基础上,有必要进一步明确商业银行作为代销机构的义务。为此,总局制定《办法》,旨在推动商业银行代销业务规范有序发展。《办法》共八章54条,主要包括以下内容:第一章总则,明确商业银行开展代销业务应当具备的条件、基本原则。第二章代销业务内部管理制度,明确商业银行开展代销业务需建立健全管理制度、业务系统、内部管理、消费者保护等机制。第三章合作机构管理,强化商业银行对合作机构的管理责任,明确合作机构准入审查要求和退出机制,明晰商业银行和合作机构的法律责任。第四章代销产品准入管理,强化商业银行对代销产品的准入管理责任,明确尽职调查要求。第五章销售管理,对商业银行宣传推介和代理销售行为作出规范。第六章代销产品存续期管理,明确存续期内商业银行应尽的义务。第七章监督管理,明确对商业银行开展代销业务的报告要求和监管措施。第八章附则,规定《办法》的施行时间等。(金融监管总局网站)
  • 三德科技
  • 沃尔核材
  • 电光科技
  • 钧崴电子
  • 金安国纪
  • 长盛轴承
  • 广和通
  • 科泰电源
  • advert
    advert
    advert
    advert