你的位置:迪士尼彩乐园3 > 迪士尼彩乐园菲律宾网 > 迪士尼彩乐园赌博害人 黄仁勋,碰到大用功

迪士尼彩乐园赌博害人 黄仁勋,碰到大用功

发布日期:2024-11-14 09:10 点击次数:150

如果您但愿可以常常碰面,迎接标星储藏哦~

正如 (Jensen Huang) 心爱说的那样,摩尔定律已死——而在本月的 Nvidia GTC 大会上,这位 GPU 大佬的首席实行官不测中败露了计较缩放定律的树大根深。

黄仁勋站在台上,不仅展示了这家芯片想象公司的下一代Blackwell Ultra处理器,还败露了磋议其未来两代加快计较平台的多量细节,其中包括一个包含576 个 GPU 的600kW 机架级系统。咱们还了解到,行将于 2028 年问世的 GPU 系列将以Richard Feynman的名字定名。你校服在开打趣!

芯片制造商常常败露其发展阶梯图并不凄迷,但咱们常常不会一次性得到这样多信息。这是因为 Nvidia 堕入了窘境。它遭逢的进击不单一个,而是好几个。更晦气的是,除了参加资金处理问题外,这些进击基本上王人不受 Nvidia 的限定。

这些挑战关于那些关注的东谈主来说并不虞外。散播式计较一直是瓶颈打地鼠游戏,而东谈主工智能可能只是终极的打地鼠游戏。

一切王人从这里出手

其中第一个亦然最昭彰的挑战是围绕计较扩展(scaling compute)。

比年来,工艺本领的高出也曾放缓。固然仍有一些可以转变的身分,但转变的难度却呈指数级增长。

面对这些搁置,Nvidia 的策略很通俗:尽可能扩大每个计较节点的硅片数目。如今,Nvidia 最密集的系统(或真确的机架)使用其高速 1.8TB/s NVLink 结构将 72 个 GPU 整合到一个计较域中。然后使用 InfiniBand 或以太网将八个或更多机架联贯在通盘,以已毕所需的计较和内存容量。

在 GTC 上,Nvidia败露了其经营将 GPU 数目擢升至每机架 144 个,最终达到 576 个。不外,限度扩大并不仅限于机架;芯片封装也雷同如斯。

一年前 Nvidia推出Blackwell 加快器时,这小数就变得无庸赘述。这些芯片的性能比 Hopper 高出 5 倍,这听起来很棒,但你坚贞到它需要两倍的芯片数目、新的 4 位数据类型和 500 瓦以上的功率能力已毕。

事实是,以 FP16 为纪律,Nvidia 顶级规格的 Blackwell 芯片仅比 GH100 快 1.25 倍,密度为 1,250 teraFLOPS,而密度为 989 —— 只是偶合有两个云尔。

到 2027 年,Nvidia 首席实行官黄仁勋瞻望,跟着 Rubin Ultra NVL576 的初次亮相,机架功率将飙升至 600kW

咱们尚不明晰 Nvidia 经营在其下一代芯片中使用哪种工艺本领,但咱们知谈 Rubin Ultra 将延续这一趋势,从两个光罩搁置芯片加多到四个。即使效果提高了约 20%,黄仁勋瞻望台积电 2nm 仍将是一个热点本领。

这不单是是计较,还有内存。眼尖的读者可能也曾严防到 Rubin 和 Rubin Ultra 之间的容量和带宽有了十分大的擢升——每个封装的288GB 对 1TB。其中约莫一半来自更快、容量更大的内存模块,但另一半来自内存专用硅片数目翻倍,从 Blackwell 和 Rubin 上的 8 个模块加多到 Rubin Ultra 上的 16 个。

更高的容量意味着 Nvidia 可以将更多的模子参数(FP4 时约 2 万亿)塞进一个封装中,或者每个“GPU”中 5000 亿个,因为他们咫尺计较的是单个芯片而不是插槽。HBM4e 还有望有用地将内存带宽提高一倍,高出 HBM3e。带宽瞻望将从咫尺每个 Blackwell 芯片的约 4TB/s 跃升至 Rubin Ultra 的约 8TB/s。

横祸的是,如果工艺本领莫得重要冲突,未来 Nvidia GPU 封装很可能会占用更多的硅片。

好音讯是,工艺立异并不是扩展计较或内存的独一模式。一般来说,从 16 位精度降至 8 位精度可以有用地使婉曲量翻倍,同期还可以将给定模子的内存需求减半。问题是 Nvidia 也曾莫得豪阔的位数可以裁减来提高性能了。从 Hopper 到 Blackwell,Nvidia 裁减了 4 位,使硅片加多了一倍,并宣称浮点性能提高了 5 倍。

但在四位精度以下,LLM 推迎接变得相配粗略,困惑度分数会赶紧上升。话虽如斯,围绕超低精度量化,咫尺有一些兴味的磋议正在进行中,精度低至 1.58 位,同期保捏准确性。

这并不虞味着裁减精度并不是提高 FLOPS 的独一模式。您还可以将较少的芯单方面积分拨给 AI 责任负载不需要的更高精度数据类型。

咱们在 Blackwell Ultra 上看到了这小数。Nvidia 加快计较业务部副总裁 Ian Buck 在一次采访中败露,他们施行上减轻了芯片的双精度 (FP64) 张量中枢肠能,以疏通 50% 以上的 4 位 FLOPS。

这是否标明 FP64 行将被 Nvidia 淘汰还有待不雅察,但如果您确实柔和双精度运算,AMD 的 GPU 和 APU 应该位于您的首选名单之首。

无论如何,Nvidia 的前进谈路是明确的:从咫尺出手,其计较平台只会变得更大、更密集、更热、更耗电。正如上周在新闻发布会上不吃热量的黄仁勋所说,机架的施行极限是你大略为其提供若干电量。

“咫尺一个数据中心的功耗是 250 兆瓦。这差未几便是每个机架的功耗搁置。我以为剩下的只是细节问题,”黄仁勋说谈。“如果你说一个数据中心的功耗是 1 千兆瓦,那么我会说 1 千兆瓦/机架听起来是个可以的搁置。”

无法遁入电力问题

自然,600kW 机架关于数据中心运营商来说是一个极其令东谈主头痛的问题。

需要明确的是,冷却兆瓦级超密集计较并不是一个新问题。Cray、Eviden 和联念念的东谈主们多年来一直在处理这个问题。变化的是,咱们驳斥的不是每幼年数几个杰作计较集群。咱们驳斥的是数十个集群,其中一些集群相配大,如果将 200,000 个 Hopper GPU 与 Linpack 绑缚在通盘可以获利的话,它们足以取代 Top500 中最弘远的超等集群。

在这种限度下,高度专科化、小容量的热经管和电力运输系统根底无法欣忭需求。横祸的是,数据中心供应商——你知谈那些销售那些让你的数百万好意思元的 NVL72 机架普通责任所需的不那么性感的破碎东西的东谈主——咫尺才赶上需求。

咱们怀疑这便是为什么到咫尺为止晓示的 Blackwell 部署中有许多王人是针对风冷 HGX B200,而不是黄一直大力宣传的 NVL72。这些八 GPU HGX 系统可以部署在许多现存的 H100 环境中。Nvidia 多年来一直在分娩 30-40kW 机架,因此跃升至 60kW 并不是什么难事,事实上,每个机架减少到两到三台工作器仍然是一种礼聘。

NVL72 是一种机架式想象,其灵感主要来自超大限度计较设备,配有直流母线、电源滑轨和前端收集。在 120kW 的液冷计较下,在现存法子中部署高出几个这样的设备很快就会出现问题。而一朝 Nvidia 的 600kW 巨型机架于 2027 年底初次亮相,这只会变得愈加坚苦。

这便是黄仁勋不停驳斥的“东谈主工智能工场”推崇作用的地点——与施耐德电气等勾搭伙伴共同想象的专用数据中心,以欣忭东谈主工智能的电力和散热需求。

令东谈主诧异的是,在详实先容了未来三年的 GPU 阶梯图一周后,施耐德晓示在好意思国进行 7 亿好意思元的彭胀,以提高守旧 GPU 所需的扫数电源和冷却套件的产量。

自然,领有为这些超密集系统供电和冷却所需的基础法子并不是独一的问题。最初,为数据中心供电也雷同是个问题,而这在很猛进程上不受 Nvidia 的限定。

每当 Meta、甲骨文、微软或其他任何公司晓示另一个 AI 比特仓库时,常常王人会有一份丰厚的电力购买公约。Meta 在河口出生的大型 DC与一座 2.2GW 的自然气发电厂同期晓示——这些可捏续性和碳中庸痛快就到此为止了。

尽管咱们但愿看到核能的纪念,但即使最乐不雅的预测也以为袖珍模块化反映堆将在 2030 年代阁下部署,因此咱们很难厚爱对待袖珍模块化反映堆。

云厂商的决定,带来压力

关于黄仁勋和英伟达来说,迪士尼彩乐园骗我钱他们还在碰到的一个问题是:云厂商似乎正在放缓他们的数据中心开辟门径。

投资银行 TD Cowen 的最新请问夸耀,微软也曾撤废了在好意思国和欧洲租出价值 2 千兆瓦数据中心容量的谈判,何况也曾推迟和取消了其他数据中心的租出。该银行的分析师以为,微软取消租约“主如果由于其决定不守旧增量式盛开东谈主工智能考验责任量”。就在脱色个月前,脱色分析师败露微软已停止了好意思国数百兆瓦数据中心容量的租约。

关于某些东谈主来说,这些取消意味着东谈主工智能上涨行将破损。

然而,咱们以为微软可能除掉其数据中心租出的原因有一个更通俗的讲解:许多数据中心无法欣忭高端东谈主工智能硬件产生的电力和冷却需求。

Nvidia 的大限度 NVL72机架级系统痛快,推理责任负载的性能将达到其 Hopper GPU 的 30 倍或更高,考验性能将达到其 Hopper GPU 的 4 倍。这种性能是以更密集的机架、更高的功耗和更多的废热产生为代价的。装配 Nvidia 最新产物的机架额定功率为 120kW,是典型 Hopper 机架的三倍。液体冷却不再是一种礼聘,而是一种不可幸免的条件。

正如 TD Cowen 所指出的,超大限度企业和云提供商必须从新想象他们的数据中心,以稳当超密集、耗电的设备——而这样作念绝非易事。

根据起诉书,路易吉·曼吉奥内在纽约州面临11项指控,包括一项一级谋杀罪和两项二级谋杀罪。此外,他还面临四项联邦指控。据路透社报道,如果罪名成立,路易吉·曼吉奥内最高将面临无期徒刑,并且不得假释。尽管他面临重罪指控,但美国很多民众却将其称为“当代”,并表示其无罪。

俄罗斯联邦共产党斯维尔德洛夫斯克地区委员会第一书记亚历山大·伊瓦切夫 (Alexander Ivachev) 告诉俄罗斯国际广播电视总公司,斯维尔德洛夫斯克 (Свердловского)州伊尔比特(Ирбит)市市长办公厅将列宁纪念碑装扮成圣诞老人的想法令人震惊愤慨,这是一种挑衅。他承认,这是政府对那些反对重新命名列宁广场的人的“回应”。

因此,微软签署的数据中心租约并不可处理 Nvidia 的最新套件(以及接下来的套件)——无论后者是作念什么的——王人是短视的。

Omdia 首席分析师 Alan Howard 向The Register暗示,数据中心容量诡计“是一个相配辣手的游戏,最不但愿出现的情况是需求高出容量。与实行比较,获取地皮和确保电力的所有经由资本较低。”

如果微软经营租出的数据中心或主机托管法子无法欣忭这些更密集系统的需求,那么不难瓦解为什么这家软件巨头会撤废并专注于开辟专用法子或革新到更相宜的地点。

微软也曾暗示信赖需要全新的数据中心想象,致使在 2024 年详实制定了此类法子的经营。

然而,TD Cowen 指出,让新建数据中心的容量参加使用需要时刻。重要部件和动力供应的枯竭也对这一情况不利。Omdia 的 Howard 暗示,咫尺重新出手构建一个数据中心约莫需要 24 个月,并指出 xAI 在田纳西州的 Colossus 集群是在 10 个月内建成的。

TD Cowen 宣称,微软已指点其数据中心勾搭伙伴出手雠校现存法子以守旧液体冷却。而且,咱们严防到,可以使用过谈内冷却剂储存器、分拨单位和液体-空气热交换器来守旧现存设备大厅中的液体冷却系统。

事实上,该银行的分析标明,跟着东谈主工智能责任负载从考验转向推理,雠校可能比新租约更能体现增长。

该文献指出:“咱们越来越信赖,推理需求的开动目的将是超大限度雠校的速率,而不是主要市鸠集第三方租出在现存可用区域内增量子部署的速率。”

不外,由于 Nvidia 也曾在诡计 600kW 机架,雠校后是否能欣忭用户的需求还有待不雅察。

除了雠校新法子以外,值得严防的是,微软也曾领有多量 Hopper GPU,其中许多王人用于运行 OpenAI 的考验责任负载。

如果微软如实像 TD Cowen 所宣称的那样减少了对 OpenAI 的考验责任,那么雷德蒙德可以将计较才略颐养为我方的推理责任负载,或将其出租给客户。

微软发言东谈主在声明中暗示,该公司仍痛快在 2025 财年在基础法子上参加 800 亿好意思元。

“收货于咱们迄今为止所作念的多量投资,咱们完满有才略欣忭面前和不停增长的客户需求。仅昨年一年,咱们加多的产能就高出了历史上任何一年。固然咱们可能会在某些规模政策性地调养基础法子,但咱们将连续在扫数地区保捏强健增长。这使咱们大略投资和分拨资源到未来的增长规模,”该发言东谈主暗示。

奴隶领头羊

需要明确的是,这些进击并非 Nvidia 私有。AMD、英特尔以及扫数其他争夺 Nvidia 市集份额的云提供商和芯片想象师不久后必定会遭逢雷同的挑战。Nvidia 偶合是第一个遭逢这些挑战的公司之一。

固然这如实有其谬误,但它也使 Nvidia 处于一个额外的地位,可以影响未来数据中心电源和热想象的标的。

正如咱们之前提到的,黄仁勋之是以兴盛败露其下一代三代 GPU 本领并预报其第四代本领,是为了确保其基础法子勾搭伙伴大略在这些本领最终问世时为其提供守旧。

黄仁勋暗示:“我之是以向全宇宙公布 Nvidia 未来三至四年的发展阶梯图,是为了让其他东谈主王人可以进行诡计。”

另一方面,这些竭力于也为竞争芯片制造商扫清了谈路。如果 Nvidia 想象出 120kW 或咫尺的 600kW,机架和主机托管提供商以及云运营商兴盛守旧这小数,那么 AMD 或英特尔咫尺就可以将雷同多的计较才略装入他们我方的机架级平台,而不消惦念客户会把它们放在何处。

关于英伟达来说,还有一个不祥情身分,那便是他们在中国的业务。

在昔日几年,拜登发布了多项禁令,阻隔英伟达向中国出售最先进的芯片。咫尺,英伟达可以销售到国内的数据中心包括 A100 和 H100功能减轻版块的A800 和 H800 芯片,以及其后的功能更弘远的H20。其中,H20更是成为咫尺中国最为热销的GPU。因为固然H20 的中枢数目减少,性能较低,但仍大略提供 AI 功能。致使连谷歌和 Meta 等大公司王人在使用这种GPU。

凭证 Nvidia 的10-K 表,中国大陆和香港是该芯片制造商的第四大市集,占其 2025 财年收入的约 13%(即 171 亿好意思元)。

然而,据《金融时报》报谈,中国监管机构将出台先进芯片的能效功令。这些功令将退却中国客户在开辟或扩建数据中心时使用 Nvidia 的 H20 芯片。《金融时报》称,固然新规尚未全面实施,但监管机构正在劝戒中国科技巨头订购 H20。

据英国《金融时报》报谈,英伟达正在寻求与中国监管机构进行谈判,并接洽进行本领变革以欣忭功令。然而,这些变化可能会减轻芯片的性能。这就让英伟达靠近销售额被华为等中国国内竞争敌手抢走的风险。

Nvidia 在给英国《金融时报》的一份声明中暗示:“咱们的产物在咱们工作的每个市集王人具有极佳的能效和价值。跟着本领的快速发展,出口管制政接应该进行调养,以允许好意思国公司提供尽可能节能的产物,同期仍能已毕政府的国度安全主义。”

半导体杰作公众号推选

专注半导体规模更多原创内容

关注群众半导体产业动向与趋势

*免责声明:本文由作家原创。著述内容系作家个东谈主不雅点,半导体行业不雅察转载仅为了传达一种不同的不雅点,不代表半导体行业不雅察对该不雅点赞同或守旧,如果有任何异议,迎接磋议半导体行业不雅察。

今天是《半导体行业不雅察》为您共享的第4079期内容,迎接关注。

『半导体第一垂直媒体』

及时 专科 原创 深度

公众号ID:icbank

心爱咱们的内容就点“在看”共享给小伙伴哦

友情链接:

迪士尼彩乐园菲律宾网 迪士尼彩乐园骗我钱

Powered by 迪士尼彩乐园3 RSS地图 HTML地图

Copyright Powered by站群 © 2013-2024