黄仁勋:AI算力集群会扩张到100万芯片,莫得任何物理定律可拦阻
发布日期:2024-11-10 09:30 点击次数:73
梦晨 发自 凹非寺
量子位 | 公众号 QbitAI英伟达市值重回第一之际,黄仁勋再次接受采访。
除了谈我方和英伟达,还吹了一波马斯克,再再再次扶直xAI只花19天建起10万卡H100超等集群。
传奇英伟达正在筹商投资xAI,梗概此言不虚。
在这场访谈中他建议,莫得任何物理定律不错拦阻AI数据中心扩张到一百万芯片。
这很难,但再行发贤慧能的讲演太大,无法不去尝试。
为此他还建议了超等摩尔定律,从每两年性能翻倍,酿成每年翻两到三倍。
并指路了具体末端路子,软硬件协同设计和数据中心级立异。
围不雅网友暗示:很惊东谈主,但更惊东谈主的是我绝不怀疑他们真的能作念到。
这是老黄第二次参加访谈节目o Priors,距离前次时隔一年。
在这场36分钟的访谈中,老黄还裸露了更多行业内幕和对将来的设计:
摩尔定律的两个基本时间撑握依然际遇瓶颈ChatGPT正在旧的磨砺集群上作念推理,英伟达基础设施不错在磨砺和推理中互相调遣英伟达不奏凯把数据中心当居品销售,但必须像对待居品一样对待它xAI速即建起超等集群主要归功于马斯克的意志力和引申力英伟达里面高度依赖AI芯片设计,如果莫得AI,造不出Hopper架构半导体行业并不是对于制造芯片,而是对于为社会构建基础结构AI智能体不会干掉SaaS,SaaS销售专科智能体会带来隆盛发展两三年后,每篇论文、每项科学和工程冲破都会以AI老黄现时每天学习任何东西都会先用AI,即使是最基础的事实也会用AI反复核查……以下是采访全文编译整理。
英伟达将来十年的赌注主握东谈主:
英伟达依然走过了30年,预测将来的十年,您以为还有哪些伏击的赌注需要下?接下来是否只需扩大范围?在从现存架构中榨取更多缱绻和内存方面,咱们是否际遇了截止?您现时的关注要点是什么?
黄仁勋:
如果退一步念念考咱们所获取的成就,咱们依然从编程走向了机器学习,从编写软件器用到创建一个全新的生态系统。
悉数这些领先都运行在为东谈主类编程设计的CPU上,如今则运行在为AI编程设计的GPU上,主若是机器学习。
宇宙依然改造,咱们进行缱绻的神气、悉数这个词时间栈都发生了变化。
咱们能够管理的问题的范围也发生了巨大变化,如果你能在一块GPU上并行化你的软件,你就为在悉数这个词集群、致使多个集群或数据中心上并行化奠定了基础。
我以为,咱们依然为将缱绻扩张到无东谈主设想过的水平作念好了准备,并在这个水平上开发软件。
接下来的十年里,咱们但愿每年在举座范围上(而非单个芯片上)将性能提高两到三倍,从而使成本和能耗每年裁减两到三倍。
当你每年都翻倍或三倍增长,几年下来,这种复合增长会相配惊东谈主。
咱们能高出东谈主们对摩尔定律的知道,即每两年性能翻倍,咱们将进入某种“超等摩尔定律”的弧线。
怎样高出摩尔定律主握东谈主:
你以为是什么让这一切比摩尔定律发生得更快?我知谈摩尔定律有点自我末端的性质,先建议了这个主义,然后东谈主们发奋去末端它。
黄仁勋:
(摩尔定律)有两个基本的时间撑握。一个是Dennard Scaling,另一个是Carver Mead’s VLSI Scaling。
这些都是严格的顺序,但相关时间如实依然到了瓶颈。因此,咱们现时需要一种新的扩张神气。
伊始,新的缩放神气显豁波及到(软硬件)协同设计。
除非你能修改或改造算法以反应系统的架构,或者改造系统以适应新软件的架构,往来迭代,不然你毫无但愿。
但如果你能同期限度这两方面,你就不错作念一些事情,比如从FP64到FP32,再到BFLOAT,再到FP8,致使FP4,致使更小的精度。
是以我以为,协同设计是其中相配伏击的一部分。
第二部分,咱们称之为全栈优化,是数据中心级别的立异。
咱们现时处理的大多数缱绻挑战,其中一个最令东谈主欢快确天然是推理时辰的扩张,基本上是以极低的蔓延生成token,进行树搜索,链式念念维,可能在脑海中进行一些模拟,反念念我方的谜底。
AI将自我辅导,肃静地生成文本,并但愿在一秒钟内作念出响应。唯独能作念到这少许的顺序是你的蔓延极低。
与此同期,数据中心仍然需要产生高糊涂量的token,因为你仍然但愿裁减成本,保握高糊涂量,末端讲演。
这两个基本条目——低蔓延和高糊涂量——是相互矛盾的。
为了创造在两者上都相配出色的东西,咱们必须去发明一些新东西,NVLink恰是咱们末端这一筹画的神气。”
磨砺和推理基础设施的互相调遣主握东谈主:
您的大客户中,有些许东谈主在筹商基础设施在大范围磨砺和推理之间的互相调遣?
黄仁勋:
现时的基础设施是解耦的。
Sam(Altman)刚刚告诉我,他最近退役了Volta。他们有Pascal,有Ampere,各式不同成立的Blackwell行将到来。
有些是为风冷优化的,有些是为液冷优化的,你的做事需要愚弄悉数这些。
英伟达的上风在于,今天为磨砺构建的基础设施,未来将相配得当用于推理。我肯定,大部分的ChatGPT做事都是在最近用于磨砺的同类型系统上进行推理的。
如果你能在上头磨砺,你就能在上头推理。
你实足有信心这些投资会得到讲演,然后插足新的基础设施来扩大范围。
而且英伟达和悉数这个词生态系统将接力于校正算法,使你的基础设施在短短一年内性能提高五倍,这种进展永久不会改造。
因此,东谈主们将这么看待他们的基础设施:
是的,尽管今天为磨砺而构建它,同期会知谈它将在推理方面也会相配出色。
而推理将是多圭臬的。
伊始,为了蒸馏出更小的模子,领有一个更大的模子看成源流是很好的。因此,你仍然会创造这些令东谈主难以置信的前沿模子,它们将用于始创性的使命,用来生成合成数据,用大模子来教学小模子,蒸馏出更小的模子。
但最终,你会有从巨型到微型的各式模子。微型模子将在特定任务上相配灵验,天然泛化智商不如大模子,但在阿谁任务上阐发相配出色。咱们将在一个小小的鸿沟中看到高出东谈主类的任务,由一个小小的模子完成。也许这不是一个小言语模子,而是一个微型言语模子,Tiny Language Model,或者其他什么。
是以我以为咱们会看到各式大小的模子,咱们的但愿是,就像今天的软件一样。
构建和托付好意思满的数据中心主握东谈主:
英伟达为客户提供的支握正在像更大的范围发展,从单个芯片到做事器,再到机架,再到NV72,您怎样看待这一进度?接下来会是什么?英伟达是否应该作念悉数这个词数据中心?
黄仁勋:
事实上,咱们如实构建了好意思满的数据中心。
咱们的作念事神气是,如果你要开发软件,你需要好意思满体式的缱绻机。咱们不会只作念幻灯片演示然后托付芯片,咱们构建悉数这个词数据中心。
在完成悉数这个词数据中心之前,你奈何知谈软件是否平日使命?在悉数这个词数据中心建成之前,你奈何知谈你的蚁集是否平日使命,以及你生机的闭幕是否达到了?
这即是为什么常常看到某些居品的本色性能远低于他们在幻灯片上展示的峰值性能的原因。
缱绻依然不像昔日那样。我常说,新的缱绻单元是数据中心。
对于咱们来说,这即是你必须托付的东西,这即是咱们现时构建的东西,咱们构建悉数这个词系统,何况以好意思满的体式构建它。
然后以各式组合进行测试,风冷的x86,液冷的Grace,以太网,Infiniband,加上NVLink,不加NVLink,等等。
咱们构建每一种成立,咱们公司现时有五台超等缱绻机,来岁咱们很容易再建五台。
如果你对软件很精致,你就会构建我方的缱绻机,何况咱们以“数据中心即居品”的神气构建它们。
尽管咱们不奏凯销售数据中心看成居品,但咱们必须像对待居品一样对待它。
对于它的贪图、竖立、优化、诊疗、保握运行的一切,筹画是让它像掀开你的簇新iPhone一样,一切都能平日使命。
天然,这背后只怕间的遗迹,但咱们现时有智商作念到这少许。
因此,如果你对数据中心感兴趣兴趣,只需要给我一个空间,一些电力和冷却系统,咱们将在30天内匡助你竖立起来。这诅咒常了不得的。
xAI的超等集群主握东谈主:
最近有一个令东谈主印象潜入的案例,即是你们为xAI速即竖立了一个集群。如果你得志,请谈谈这个案例,因为无论是范围如故速率都令东谈主恐惧。
黄仁勋:
好多功劳要归功于马斯克。
伊始,决定去作念这件事,选择形式,引入冷却和电力,然后决定竖立一个领有10万个GPU的超等集群,这是有史以来最大的范围。
然后倒推日程,咱们沿途贪图他要启动系统的日历,这个日历是在几个月前详情的。
悉数的组件、OEM、系统、咱们与他们团队的软件集成、悉数的蚁集模拟,咱们都事先以数字孪生的神气模拟了他的蚁集成立。咱们事先准备了他的供应链,事先安排了悉数的蚁集布线。咱们致使竖立了一个小范围的版块看成参考,以便在悉数征战到达之前进行测试。
到悉数征战到达的时候,一切都依然准备就绪,悉数的锻练都完成了,悉数的模拟都完成了,然后是大范围的集成,深广的团队在沿途日夜抑遏地使命,几周内集群就启动了。
这真的是他(马斯克)的意志力和他能够念念考机械、电气问题并克服巨大贫苦的施展注解。
主握东谈主:
如果你预测将来,达到20万、50万、100万的超等集群,您以为最大的贫苦是什么?本钱、动力、供应?
黄仁勋:
你刚才提到的这些成分,莫得一件是缓和的。
是否值得追求这么的范围扩张?不消置疑是值得的。
要达到咱们设想中的那种缱绻机,能够缓和地完成咱们条目它作念的事情,具有某种通用智能。致使咱们不错争论它是否真的具有通用智能,但即使接近它亦然一个遗迹。
我以为有五到六个团队在发奋尝试末端这一筹画,有OpenAI、Anthropic、xAI,天然还有谷歌、Meta、微软等公司。
这个前沿鸿沟,在登攀这座山岭的进程中,接下来的几步是至关伏击的。谁不想成为登上这座山岭的第一东谈主?
我以为,再行发贤慧能的犒赏太过伏击,无法不去尝试。
我以为,莫得物理定律的截止,但一切都会很难。
AI芯片设计和英伟达的运作神气主握东谈主:
一年前,当咱们沿途交谈时,咱们问过您,英伟达在东谈主工智能和其他鸿沟中,您对哪些应用流毒最感兴趣兴趣,接下来将为客户提供哪些做事,您谈到了您最极点客户的一些科学应用。
在昔日的一年中,这依然成为更主流的不雅点。东谈主工智能在科学中的应用是否依然最令您欢快?
黄仁勋:
我很喜跃在英伟达有AI“芯片设计师”,有AI“软件工程师”。
它们相配高效,如果莫得它们,咱们无法构建Hopper。
它们与东谈主类比拟不错探索更大的空间,因为它们有无尽的时辰,它们在超等缱绻机上运行。咱们的东谈主类工程师时辰有限,无法探索尽可能多的空间,也无法组合地探索空间。
我无法在我方探索的同期,涵盖你的探索和其他东谈主的探索。
咱们的芯片如斯之大,它们并不是看成一个芯片设计的,而是像一千个芯片那样设计的。咱们必须区分优化每一个。
你真的想要优化更多的模块,跨模块协同设计,优化更大的空间。
莫得东谈主工智能,咱们的工程师无法作念到,咱们莫得饱胀的时辰。
主握东谈主:
自从咱们前次交谈以来,还有一件事发生了变化。我查了一下,其时英伟达的市值约为5000亿好意思元,如今已跨越3万亿好意思元。在昔日的18个月里加多了2.5万亿好意思元的市值,特等于每月加多了1000多亿好意思元。
今天早些时候我来到英伟达公司,感受到了公司的活力,就像15年前我在谷歌时一样,能感受到公司的能量和欢快。
在这段时辰里,有什么变化吗?或者说,有什么不同之处,无论是英伟达的运作神气,如故您对宇宙的办法,或者您不错接管的赌注的范围?
黄仁勋:
公司无法像股价那样快速变化,是以在好多方面,咱们并莫得太大改造。
我以为,咱们需要退一步,问问我方,咱们在作念什么?
从行业角度来看,咱们再行发明了缱绻。它依然60年莫得被再行发明过了,这是一件何等伏击的事情。
在昔日的10年里,咱们将缱绻的角落成本裁减了约莫一百万倍,以至于咱们不错说,让缱绻机去穷举地编写软件吧。
某种程度上,咱们不错说,咱们也在芯片设计中说了同样的话。咱们但愿缱绻机去发现一些咱们我方无法作念到的对于芯片的东西,探索咱们的芯片,并以咱们无法作念到的神气优化它。
因此,东谈主们运转意志到,咱们再行发明了缱绻。
但这究竟意味着什么?俄顷之间,咱们创造了一个称为“智能”的东西,那么缱绻发生了什么变化呢?
咱们从数据中心运转。
数据中心是存储文献的多佃户场所。而咱们正在创建的新式数据中心并不是传统的数据中心。它们不是多佃户的,往往是单佃户的。它们不存储任何文献,只是在生成一些东西——它们在生成tokens。
这些tokens被再行组合成看似智能的东西,而这种智能有各式不同的体式,可能是机器东谈主的动作抒发,可能是氨基酸的序列,可能是化学链,或者各式谈理的东西。
那么,咱们究竟在作念什么?咱们创造了一种新器用,一种新的机器,在好多方面,它是“生成式东谈主工智能”这个边幅词的名词体式。
与其说是生成式东谈主工智能,不如说是一个东谈主工智能工场。它是一个生成东谈主工智能的工场,而且咱们正在以极大的范围来末端这少许。
东谈主们运转意志到,这可能是一个新行业。它生成tokens,生成数字,但这些数字以特等有价值的神气构成。那么,哪些行业会从中受益?
然后,你再退一步,问我方英伟达在作念什么。
一方面,咱们再行发明了咱们所知谈的缱绻,因此有价值数万亿好意思元的基础设施需要当代化,这是其中一层。
更大的层面是,咱们正在构建的这个器用不单是是为了咱们正在当代化的数据中心,而是用于坐褥一些新的商品。这个新商品行业能有多大?很难说,但可能价值数万亿好意思元。
是以,如果你退一步看,咱们不再制造缱绻机了,咱们在制造工场。
每个场所都需要它,每个公司都需要它。你能举出一个公司或行业说“你知谈吗,咱们不需要坐褥智能,咱们依然领有饱胀多了”吗?
是以,我以为这是一个要紧理念,这是一种综合的产业视角。
有一天,东谈主们会意志到,在好多方面,半导体行业并不是对于制造芯片,而是对于为社会构建基础结构。然后,俄顷之间,公共都会说:“啊,我领悟了,这是件大事。”
具身智能主握东谈主:
您现时怎样看待“具身化”?
黄仁勋:
我相配欢快的少许是,在好多方面,咱们接近于东谈主工通用智能,但咱们也接近于东谈主工通用机器东谈主。token即是token,问题是你能否将其token化。
天然,正如你们所知,token化并封锁易。但如果你能够将事物token化,与大型言语模子和其他模态对都,假如不错生成一个视频,内容是我伸手去拿咖啡杯,为什么我不成辅导机器东谈主生成能够提起咖啡杯的token呢?
直观上,你会以为对于缱绻机来说,问题述说是特等相似的。是以,我以为咱们相配接近了,这令东谈主难以置信的欢快。
现时,有两个“棕地”(Brownfield)机器东谈主系统——“棕地”意味着你不需要改造环境——即自动驾驶汽车和具身机器东谈主。
通过汽车和东谈主形机器东谈主,咱们本色上不错在不改造宇宙的情况下将机器东谈主带到宇宙上,因为咱们依然为这两样东西构建了宇宙。
也许马斯克专注于这两种体式的机器东谈主并非正好,因为它们可能具有巨大的潜在范围。
是以,我以为这是令东谈主欢快的,但其数字版块同样令东谈主欢快。
咱们正在驳斥的是数字职工或AI职工。毫无疑问,咱们将领有各式千般的AI职工。将来将领有生物智能和东谈主工智能,咱们以相似的神气去辅导(Prompt)它们。
我大多数时候都是辅导我的职工,向他们提供布景,条目他们引申任务,他们会去招募其他团队成员,然后回想,咱们往来疏导。这与各式AI职工有何不同呢?
是以,咱们将领有东谈主工智能营销东谈主员、东谈主工智能芯片设计师、东谈主工智能供应链东谈主员等等。
我但愿有一天,英伟达在生物智能层面上变得更大,但在东谈主工智能层面上变得大得多。这是咱们将来的公司。
主握东谈主:
如果咱们一年后再来和您交谈,您以为公司哪个部分最具东谈主工智能化?
黄仁勋:
我但愿是芯片设计,这是最伏击的部分。因为它对咱们的影响最大,亦然咱们不错产生最大影响力的场所,这是一个极其困难的问题。
咱们与Synopsys和Cadence合作。我实足不错设想他们领有AI芯片设计师给我租用,他们对特定的模块有所了解,练习使用特定的器用,咱们将凭证需要雇佣一大量他们的东谈主工智能设计师,在芯片设计的对应阶段匡助咱们。
也许我会租用一百万个Synopsys的工程师来匡助我,然后再租用一百万个Cadence的工程师来匡助我。对他们来说,这是一个何等令东谈主欢快的将来,他们领有悉数这些智能体,在他们的器用平台之上并与其他平台结合。
你也会在SAP和ServiceNow那儿这么作念。东谈主们说这些SaaS平台将被颠覆,我本色上以为相背,他们正坐在金矿上,如Salesforce、SAP等将因专科智能体隆盛发展。
Salesforce有Lightning,SAP有ABAP,每个东谈主都有我方的言语,对吗?咱们有CUDA,还有用于Omniverse的OpenUSD。
谁会创建一个在OpenUSD上相配出色AI智能体?咱们会,因为莫得东谈主比咱们更顺心它。
因此,我以为在好多方面,这些平台将表现出大量的智能体,咱们将把它们相互引介,它们将协同合作,管理问题。
AI for Science主握东谈主:
您看到有许多东谈主在东谈主工智能的各个鸿沟使命,您以为有哪些被低估的鸿沟,或者您但愿更多的企业家、工程师或贸易东谈主士参与哪些方面的使命?
黄仁勋:
伊始,我以为被曲解和低估的是在水面之下的活动,即在东谈主工智能和机器学习影响下的冲破性科学、缱绻机科学和工程学。
我以为,你无法走进任何一个科学系、表面数学系,而不看到东谈主工智能和机器学习,以及咱们今天所驳斥的这些使命将如安在未来带来变革。
如果你把宇宙上的悉数工程师、悉数科学家聚在沿途,何况你以为他们今天的使命神气是将来的早期迹象,那么你将在短时辰内看到东谈主工智能的海啸,机器学习的海啸,改造咱们所作念的一切。
请记着,我看到了缱绻机视觉的早期迹象,看到Alex、Ilya和Hinton的使命(AlexNet),看到Yann LeCun,天然还有斯坦福的吴恩达。
咱们很走时地从猫的视觉臆度出了缱绻机科学和缱绻的潜入变革,这么的臆度对咱们来说是走时的。
现时咱们被它所激发,以至于改造了咱们悉数的作念事神气。
但这花了多永劫辰?从不雅察到阿谁玩物般的AlexNet,按今天的法式它被以为是一个玩物,到在物体识别方面达到高出东谈主类的智商,只用了几年时辰。
现时正在发生的是悉数科学鸿沟变革的海浪,莫得一个科学鸿沟被落下。
我想相配明确地说,从量子缱绻到量子化学,悉数科学鸿沟都参与了咱们正在磋议的(AI结合)顺序。
如果咱们再给我方两三年时辰,宇宙将会改造,将不会有一篇论文、一项科学或工程冲破,其基础不是生成式东谈主工智能。我现时相配详情这少许。
对于好多对于这是否是好景不常的问题,你只需要回到第一旨趣,不雅察本色发生的事情。
缱绻堆栈,也即是咱们进行缱绻的神气,依然改造。编写软件的神气依然改造,这诅咒常中枢的东西。
软件是东谈主类编码常识的神气,这是咱们编码算法的神气。咱们现时以相配不同的神气编码它,这将影响一切,其他任何东西都将不同于以往。
是以,我以为,我是在和已司知道这少许的东谈主交谈,咱们都看到了同样的事情。
你们所合作的悉数初创公司,我所合作的科学家和工程师,莫得东谈主会被落下。
咱们将带着悉数东谈主沿途前进。
黄仁勋每天都在用AI黄仁勋:
我我方每天都在使用AI,我不知谈你们奈何样,但AI现时是我的导师。
我学习任何东西都会先去找AI。
为什么要用困难的神气去学习呢?奏凯去找AI,奏凯去找ChatGPT,或者只怕我会用Perplexity,这取决于我问题的表述神气,我就从那儿运转学习。然后,如果你得志,你不错深入筹商。
但天哪,这真的太棒了。确实悉数我知谈的东西,我都会再三阐发。即使对于一个事实,我以为的基本真义,而且我是大家,我仍然会去找AI,查验、再查验。
这太棒了,现时我作念确实悉数的事情都波及到AI。
One More Thing最新爆料,凭证最近行将出书的张忠谋列传,2013年傍边台积电曾磋议黄仁勋是否有兴趣兴趣接任CEO,但老黄间隔了。
10多年前,英伟达还不是像今天这么的硕大无朋。但刚刚推出Kepler架构GPU系列,新的Tegra系列出动芯片,以及Shield游戏机,并陆续报复数据中心。
其时黄仁勋对英伟达将来充满信心,秘书在公司现存总部以西建造一个更大的总部。
台积电不得不选择Plan B,从里面教训两名工程师高管并培养成商东谈主,竖立双指挥制,区分担任董事长和CEO。看成对比,黄仁勋一直在英伟达同期担任董事长兼CEO。
现时,黄仁勋对数据中心和东谈主工智能的政策愿景匡助英伟达成为全球市值最高的公司。
好意思满视频:
https://youtu.be/hw7EnjC68Fw?si=SbOfncJCXs0_zt3L参考流畅:
[1]https://www.tomshardware.com/tech-industry/tsmc-founder-once-asked-nvidias-jensen-huang-to-take-the-reins-according-to-upcoming-morris-chang-biography— 完 —
量子位 QbitAI · 头条号签约
关注咱们,第一时辰获知前沿科技动态