随着人工智能从实验室走向工业,超级计算机将成长为价值数十亿美元的庞然大物。
下一代人工智能超级计算机在尺寸、成本和电力需求方面正在形成巨大的规模。
乔治敦大学(Georgetown)、Epoch AI和兰德公司(Rand)的研究人员进行的一项新研究显示,到本十年末,训练和运行人工智能系统所需的基础设施可能会变得多么庞大。
从2019年到2025年,领先的人工智能数据中心的硬件成本和功耗每年都会翻一番。
如果这种指数级增长继续下去,我们可能会在2030年看到一台人工智能超级计算机,它拥有200万个芯片,耗资2000亿美元,消耗9吉瓦的电力,大约相当于9个核反应堆的发电量。
电力需求的增长超过了效率的提高
虽然数据中心的效率越来越高,但这还不足以控制总体的能源需求。
研究发现,从2019年到2025年,每瓦的计算性能每年提高1.34倍。
然而,在同一时期,电力需求以每年2倍的速度增长。
Epoch AI指出:“人工智能超级计算机的能效正在提高,但这种转变的速度还不足以抵消整体功率的增长。”
他们的估计表明,9吉瓦的电力可以让700万到900万户家庭用上电 —— 这远远超出了今天的能力。
目前,最先进的人工智能超级计算机是xAI的“巨像(Colossus)”,耗时214天,耗资70亿美元。
它使用20万个人工智能芯片,耗电量为300兆瓦,相当于25万户家庭的用电量。
人工智能超级计算机的扩展速度有多快,它们在哪里,谁拥有它们?
研究人员的新数据集涵盖了过去六年里500多个最大的人工智能超级计算机(又名GPU集群或人工智能数据中心)。
工业现在主导着人工智能超级计算机领域
早在2019年,私营公司就拥有40%的人工智能超级计算能力。到2025年,这一数字已飙升至80%。这一转变反映了人工智能如何从学术探索转向商业金矿。
Epoch AI的论文解释说:“超级计算机曾经只是用作研究工具,现在它们被用作提供经济价值的工业机器。”
因此,私营部门系统的规模和范围迅速增长,每年增长2.7倍,而公共部门的机器每年增长1.9倍。
OpenAI的5000亿美元星际之门项目和NVIDIA最近承诺的5000亿美元只是大量资本流入人工智能基础设施的两个例子。
美国在全球人工智能计算领域处于领先地位
根据这项研究,美国目前控制着大约75%的人工智能超级计算能力。
中国以15%的份额紧随其后,而日本和德国等传统超级计算国家所占的份额较小。
然而,这些数据中心的物理位置并不一定反映谁使用它们,因为许多数据中心提供通过云的远程访问。
不过,托管这些设施需要做出重大权衡。
Good Jobs First的一份报告估计,由于对数据中心的慷慨激励,美国至少有10个州每年损失超过1亿美元的税收。
此外,这些中心消耗了大量的水和土地,使当地的生态系统紧张。
可能的冷却期
尽管有这样的发展轨迹,但并非所有迹象都指向不受控制的增长。
2025年初,Cowen的分析师指出,随着AWS和微软等超大规模企业撤出一些项目,市场将“降温”。
这究竟是预示着经济永久放缓,还是战略暂停,仍有待观察。
但有一件事是明确的 —— 人工智能的崛起与制造更大、更耗电的机器的竞赛是同义词。
如果朋友们喜欢,敬请关注“知新了了”!