若是您但愿不错平庸碰头,接待标星保藏哦~
开始:内容编译自nextplatform,谢谢。
不错笃定地说,在 2025 年,寰球上最好的使命是 Nvidia 的首席践诺官,而该公司的诱骗首创东谈主黄仁勋 (Jensen Huang) 指导公司走向了简洁,就像诱骗首创东谈主托马斯·沃森 (Thomas Watson) 指导公司走向公司 (International Business Machines)、拉里·埃里森 (Larry Ellison) 指导公司走向甲骨文公司 (Oracle) 以及史蒂夫·乔布斯 (Steve Jobs) 指导公司走向苹果电脑公司 (Apple Computer) 相通。
但 Nvidia 的第二好使命无疑是 Bill Dally 所从事的使命。或者更真实地说,Dally 同期从事这两份使命。Dally 于 2009 年出任 Nvidia 首席科学家,在此之前,他曾担任斯坦福大学计较机科学系主任十几年,并在麻省理工学院和加州理工学院从事芯片、互连和系统筹商数十年,收成斐然。Dally 说,他会和顺公司里面发生的一切,并戮力让悉数这些技能“尽可能地好”。在圣何塞举行的最新 GPU 技能大会上,Dally 在演讲中补充说,他还有另一份使命,负责经管 Nvidia 筹商部门,这意味着他不错“与好多真实聪惠的东谈主一皆科罚好多粗重的智商问题”。
Dally 的演讲老是很真义,最近一次 GTC 上的演讲也不例外。像正常相通,Dally 挑选了一些硬件和软件方面的精技能术,并潜入筹商了它们,展示了它们如何为 Nvidia 带来了现时的上风,或者将来在销售 GPU 加快系统方面可能带来的上风。
这让咱们预料了 Nvidia 的研发支拨,这笔支拨畸形大,但由于 Nvidia 曩昔一年半的收入和利润激增,这笔支拨面前看起来微不及谈。但毫无疑问:Nvidia 插足巨资打造将来,面前它从中受益最多,比地球上任何其他供应商都多。
早在 2008 年 11 月,当 Nvidia 在奥斯汀举行的 2008 年超等计较大会上初次在 HPC 模拟和建规范畴推崇其 GPU 计较愿景时(这比第一届 GPU 技能大会在费尔蒙货仓举行,约有 1,500 名与会者),IBM 基于 AMD Opteron CPU 和 IBM PowerXCell 数学加快器的“Roadrunner”夹杂超等计较机刚刚在昨年 5 月冲破了高性能 LINPACK 基准测试的千万亿次浮点运算遏制。为了向您展示咱们距离东谈主工智能立异和现时履行有多远,太平洋西北国度实验室举办了一场小组辩论,题为“电力公司是否会在购买电力公约期施舍超等计较机? ”
但履行却大相径庭:你会为超等计较机和电力公约支付比你遐想的预算更多的钱吗?也许咱们会向 SC25 的东谈主们提议这个问题四肢小组辩论。而这一履行完全取决于 Nvidia 数据中心 GPU 的性能、功耗和本钱。
而且,咱们合计,将来出现相反的原因部分在于,尽管带有矢量和就怕张量引擎的 CPU 也践诺深广并应用命,但 Nvidia GPU 已成为 HPC、分析和 AI 使命负载的主力并行计较引擎。
若是 Nvidia 莫得看到Brook Stream 处理编程话语的价值,那么这一切都不会发生。该话语将数学计较更正到 ATI(现为 AMD)和 Nvidia GPU 上的浮点着色器单位,并遴聘其首创东谈主 Ian Buck 创建面前所谓的 CUDA。数据中心对 GPU 计较的需求迫使 GPU 遐想控制发展,其编程堆栈也随之发展。当寰球创造了富裕的数据,使自古以来(20 世纪 80 年代初)的 AI 算法好像真实确认作用时,GPU 等于完成这项使命的最好计较引擎,并成为 AI 立异的平台——具体来说,咱们指的是经典机器学习。GenAI 至极基础模子仅仅 AI 创新波浪中的第二波波浪,将来很可能会出现好多波波浪。在 Dally 的密切和顺下,Nvidia Research 确保 GPU 芯片控制发展,况兼可能在深广并行计较中暴露精湛的使命负载不错与将来的 GPU 相结合,并保捏技能飞轮(从而保捏财富飞轮)动弹。
但这需要投资。
咱们直到 2010 年 4 月才运行追踪 Nvidia 的财务状态,也等于其 2011 财年第一季度,因为其数据中心业务尚未完结。Nvidia 直到 2015 财年第一季度才公布数据中心部门的收入,那时的收入仅为 5700 万好意思元,而那时的总销售额为 11 亿好意思元,净收入为 1.37 亿好意思元。这并非毫无神往的——咱们确实是这样合计的——Nvidia 在阿谁季度破耗了 3.37 亿好意思元(占收入的 30.6%)用于研发,况兼在曩昔两年中,其研发支拨占收入的比例一直保捏在新高,在 2014 财年第一季度达到顶峰,占收入的 34.2%。
这是 Nvidia 为利用第一波东谈主工智能波浪和为第二波波浪作念好准备所作念的基础使命。而且请宽心,它一经展望了第三波波浪(它称之为物理东谈主工智能),而且毫无疑问,它正在为第四波波浪作念准备。

面前,在生手看来,Nvidia 似乎正在大幅削减研发支拨,咱们应该挂念其将来的投资。事实并非如斯。事实是,Nvidia 之是以好像把持 GPU 计较商场,是因为它花了二十年时候创建了 CUDA 平台,该平台收罗了进步 900 个库、框架和模子,撑捏着寰球上每一个加快的 HPC 和 AI 应用规律,而且它不错为当代数据中心 GPU 运行 AI 考试使命负载所需的稀缺 HBM 内存支付实足最高的价钱,况兼由于念念路链或推理模子的计较需求,它越来越多地用于 AI 推理。
若是 HBM 不是那么稀缺和崇高,AMD 的 DRAM 将会与 MI250 和 MI300 GPU 竞争,况兼其 GPU 销量也会比面前多得多。然则 HBM 相配稀缺,AMD 无法像 Nvidia 那样支付那么多钱。然则,关于某些用户子集(HPC 东谈主群)来说,CUDA X 堆栈(Nvidia 软件的称呼)并不像对 AI 东谈主群那样进击,AI 东谈主群站在 HPC 东谈主群的肩膀上,不管他们如何抗议。(举例,NCCL 是一个经由修饰的 MPI。)这等于为什么你会看到 AMD 用其 GPU 追求传统的 HPC 中心,并在那儿赢得和顺,因为 HPC 中心在计较方濒临价钱极为敏锐。AI 客户通过计较来制作有望赢利的模子,他们不错找到浪漫数目的投资者来完结这一认识。HPC 中心依靠州和国度政府。
回来曩昔十五年,你会发现 Nvidia 的研发支拨占营收的 20% 到 25% 之间,这与 Meta Platforms 在并吞时期接办遐想我方的处事器、存储、会聚和数据中心以来所作念的差未几。谷歌倾向于将营收的 15% 到 20% 用于研发,甲骨文亦然如斯。微软的研发支拨约为 15%,高下浮动不大,亚马逊的研发支拨则低几个百分点。AMD 的研发支拨曩昔在 15% 到 20% 之间,但面前与 Nvidia 处于并吞水平。然则,在曩昔的十二个月里,Nvidia 的销售额为 1305 亿好意思元,是 AMD 258 亿好意思元的 5.1 倍。
尽管如斯,尽管 Nvidia 在 GenAI 上升时代一直在增多研发预算,但它并莫得将 20% 到 25% 的收入用于研发。事实上,自 2023 年夏令 GenAI 上升使 Nvidia 的收入和收益飙升以来,其销售额占比一直呈下落趋势。在曩昔的 12 个月中,它的平均收入略低于 10%。但与 2024 财年比拟,这仍然代表着 2025 财年增长了 48.9%,研发总数为 129.1 亿好意思元。
这张对数图不错更好地展示 Nvidia 研发支拨增长的踏实性:

咱们不知谈这个数字中有若干是研发,迪士尼彩乐园有若干是斥地,但咱们合计,跟着 Nvidia 剿袭越来越多的数据中心硬件和软件堆栈,研发投资将稳步增长,斥地本钱也将激增。很难准确说出。
正如 Dally 所说,Nvidia Research 大致将其分为两个部分,即所谓的供给方和需求方。

供应方触及从电路到系统架构等各个方面的筹商,其明确任务是提供“让 GPU 变得伟大的技能”,正如他所说。这种供应方筹商面前包括 GPU 存储系统和安全性,它们是任何买卖 AI 系统不可或缺的一部分。
需求方是对多样应用范畴进行筹商,以便加快计较范畴控制扩大,从而鼓吹对 Nvidia GPU 的需求。有两个不同的 AI 小组,一个在多伦多,另一个在特拉维夫,还有一个在圣克拉拉,从事应用深度学习筹商。台湾的实验室是进行生成式 AI 使命以及多模态学习和 3D 视觉的场所。有故意的 AI 实验室专注于机器东谈主和自动驾驶汽车,其他小组专注于大型话语模子或高效的 AI 算法。显着有三个小组专注于图形,一个小组从事量子物理和化学。
Nvidia Research 刚刚组建了一个量子计较筹商小组,试图评估该技能的近况,并了解 Nvidia 何时何地好像收拢这一机遇。
偶尔,全球也会有 Dally 所说的“登月遐想”,即来自 Nvidia 筹商机构和居品部门的筹商东谈主员将一项新技能付诸实践。RT 中枢是显卡的一部分(因此一些推理卡卖给了数据中心),用于加快光芒追踪的处理,这等于登月遐想的一个例子。该名堂于 2013 年启动,RT 中枢于 2017 年进入“图灵”GPU。
Nvidia 可能有约莫 500 名筹商东谈主员,他们肃肃从属于 Nvidia Research,但还独特千名来自居品组的工程师,他们亦然某些名堂的一部分。Nvidia 面前领有约莫 36,000 名职工,咱们臆测其中 75% 从事软件使命,这是曩昔至少十年来 Nvidia 职工的传统份额。
Nvidia Research 向居品部门更正的最到手的技能之一是 NVLink 和 NVSwitch,这是咱们之前辩论过的。但在 GTC 2025 的主题演讲中,Dally 进一步推崇:
“我本体上在 2012 年支配从动力部赢得了一份公约,那时咱们正在为 Oak Ridge 缔造超等计较机,”Dally 诠释谈,他指的是 IBM 是“Summit”超等计较机的主要承包商的公约。“四肢这些名堂的一部分,有研发资金。是以我恳求了一些资金来斥地 GPU 会聚。我铭刻,那时,动力部但愿分担该名堂的本钱。他们但愿 Nvidia 支付 40%,动力部支付 60%。我去找 Jensen,他说,“实足不成。是的,咱们不作念会聚。咱们是一家 GPU 公司。”是以我回到了动力部,庆幸的是,他们 100% 资助了斥地第一个 NVSwitch 和第一个 NVLink 的名堂。从那时起,本体上,这些名堂在咱们完成之前就被夺走了,他们意志到他们需要让几个 GPU 看起来像一个大 GPU。从那时起,Nvidia 就一直参与会聚业务。”
但达利暗意,关于 Nvidia Research 来说,最进击的技能更正可能是机器学习。
“因此,在 2011 年与斯坦福共事吴恩达共进早餐后,我让 Nvidia Research 参与了机器学习,”Dally 回忆谈。“那时他告诉我,他在 Google Brain 使用 16,000 个 CPU 在互联网上寻找猫。我想,哇,咱们不错用 GPU 作念到这小数,而且破耗的资源少得多。是以我指派那时担任编程系统筹商员的 Brian Catanzaro 与 Andrew 协作,他将该软件移植到 48 个 GPU 上运行,本体上在 48 个 GPU 上运行速率比在 16,000 个 CPU 上运行速率更快。该软件酿成了 cuDDN,并引颈咱们走上了如今深度学习的谈路。”
多年来,技能转让取得了好多到手,以下是一些例子:

Dally 在本次 GTC 上谈到的技能之一是接地参考信号,早在 2019 年夏天的 Hot Chips 上,他就曾与咱们辩论过这项技能。GRS 是一种单端信号技能,为了将其大大简化,它允许 Nvidia 通过有机基板上的导线驱动两倍的每针带宽,这是其他差分信号技能的两倍,亦然芯片旯旮每毫米带宽的两倍。六年后,GRS 信号被用于将 Nvidia 的“Grace”CG100 CPU 与 DGX GB300 系统中行将推出的“Blackwell”B300 GPU 说合起来。

早在 2013 年,当 GRS 筹商刚刚运行时,Nvidia 就能以约莫半皮焦耳/比特的速率传输 25 Gb/秒的信号,但为了使信号更踏实,它在坐褥 GRS 时将其提高到约莫 1 皮焦耳/比特。Dally 说,典型的 PCI-Express 链路需要约莫 5 皮焦耳到 6 皮焦耳/比特的信号。
每天抛出新想法,咱们期许这些想法最终能成为居品。这是插入器上基于反相器的信号,举例,您不错在单个封装上将多个 GPU 芯片相互说合:

以下是 Nvidia 针对 3D 芯片堆叠的互连形态:

以下是 3D 堆叠与中介层在每引脚带宽以及推送信号所破钞的每位飞焦耳方面的比较:

它会一直捏续下去,正如你从不雅看 Dally 在 GTC 2025 上的 Nvidia Research 演示以及他多年来在多样行为中所作念的演示中所看到的那样。
那时,IBM 相配富饶,不错进行任何它想进行的筹商。自后,当公司在 20 世纪 90 年代初堕入逆境,蓝色巨东谈主距离收歇唯唯一步之遥时,唯逐一位从外部遴聘的 IBM 首席践诺官路易斯·郭士纳 (Louis Gerstner) 所作念的第一件事等于让 IBM 筹商部门专注于科罚影响真实客户的问题。
Nvidia 从未需要再行聚积筹商东谈主员和工程师来完结这小数。他们所作念的等于这些。但愿 Nvidia 面前的收入开始和净收入池相配丰富,公司不会过度千里迷于筹商,挂念会错过行将到来的下一波波浪。它所需要作念的等于坚捏我方的 GPU knitting,,而其阶梯图标明这等于遐想。
还有一件事需要推敲:Nvidia 并不是什么都发明的,但它确乎发明了它合计需要与竞争敌手分袂开来或开拓新商场的东西。举例,Nvidia 从第三方购买 PCI-Express 交换机和重定时器。它从多个供应商那儿购买 DRAM、GDDR、HBM 和闪存。它对从外部引进的技能的特定用例有偏好,并在有必要的情况下保捏中立。当它想以比从新运行创建技能更快的速率为客户作念某事时,它会收购公司——Mellanox Technologies 等于一个很好的例子,Cumulus Networks 和 Run.ai 亦然如斯。
https://www.nextplatform.com/2025/03/30/nvidia-research-the-real-reason-big-green-commands-big-profits/
半导体杰作公众号保举
专注半导体范畴更多原创内容
和顺全球半导体产业动向与趋势
*免责声明:本文由作家原创。著述内容系作家个东谈主不雅点,半导体行业不雅察转载仅为了传达一种不同的不雅点,不代表半导体行业不雅察对该不雅点赞同或支捏,若是有任何异议,接待联系半导体行业不雅察。
今天是《半导体行业不雅察》为您共享的第4080期内容,接待和顺。
『半导体第一垂直媒体』
及时 专科 原创 深度
公众号ID:icbank
可爱咱们的内容就点“在看”共享给小伙伴哦