谷歌推出AI芯片猛兽!最强TPU算力暴涨,AI推理效能再破纪录

玩数据还有点懒 2025-04-11 04:07:34

谷歌在 Google Cloud Next 2025 开发者大会上正式发布第七代张量处理器(TPU)——Ironwood。这款专为 AI 推理设计的芯片以突破性的硬件架构和能效表现,标志着人工智能从被动响应时代迈向主动决策的新纪元。

谷歌推出新 AI 处理器

在谷歌云Next大会上,谷歌发布第七代TPU芯片Ironwood。谷歌机器学习、系统和云AI副总裁兼总经理Amin Vahdat称,Ironwood是谷歌迄今为止最强大、最节能的TPU,专为支持思考、推理类模型的大规模应用而设计。

每块Ironwood芯片的峰值算力为4614 TeraFLOPS(第六代TPU芯片Trillium的5倍),内存高达192GB(Trillium的6倍);HBM带宽达到7.2 Tbps(Trillium的4.5倍);其每瓦峰值算力为29.3 TeraFLOPS,是Trillium的2倍多。

通过芯片间互连(ICI)网络,Ironwood实现1.2 Tbps的芯片间双向带宽,最高可扩展至9216个液冷芯片组成的Pod,总算力达42.5 ExaFLOPS,是目前世界上最大超算El Capitan算力的24倍多。

对于谷歌云客户,Ironwood提供两种尺寸:256芯片配置和9216芯片配置。开发者还可以利用谷歌的Pathways软件堆栈,管理数万个Ironwood TPU的综合计算能力。全面推出的Cluster Director允许用户部署和管理具有计算、存储和网络功能的大型加速虚拟机集群。

谷歌称,Ironwood代表着AI及其基础设施的发展迎来重大转变,从提供实时信息供人类解读的响应式AI,转变为主动生成解读的AI模型,迎来“推理时代”。

开启 “AI 代理” 元年

谷歌大胆预测,随着 Ironwood 的广泛应用,将推动 “AI 代理”(AI Agent)时代的到来。这些智能体能够自主完成信息检索、数据分析以及提供决策建议等任务,成为企业数字化转型过程中的核心工具,助力企业在智能化浪潮中抢占先机 。

展望未来,AI 芯片将进一步朝着专业化方向发展,形成训练和推理两大细分赛道,其中推理芯片将更加注重低延迟和高吞吐量的性能优化。同时,云端的 Ironwood 提供超强算力,边缘 TPU 实现本地化推理,“中心 - 边缘” 一体化的架构将逐渐成为主流。

而 AI 也不再仅仅是辅助人类工作的工具,将深度融入人类决策过程,成为真正的 “数字伙伴”,全方位推动各行业的生产力实现跃迁 。

谷歌第七代 TPU Ironwood 的发布,无疑是 AI 发展历程中的一座重要里程碑。它不仅实现了硬件性能的大幅迭代,更推动了 AI 从 “工具” 向 “智能体” 的本质性转变。

当 42.5 Exaflops 的强大算力与翻倍的能效完美结合,我们看到的不仅仅是一项技术的突破,更是医疗、金融、交通等众多领域迎来颠覆性变革的曙光。在未来,AI 推理有望像电力一样,成为支撑社会运转的重要基础设施,而 Ironwood,无疑是开启这一崭新时代的关键 “钥匙” 。

免责声明:

1、本号不对发布的任何信息的可用性、准确性、时效性、有效性或完整性作出声明或保证,并在此声明不承担信息可能产生的任何责任、任何后果。

2、本号非商业、非营利性,转载的内容并不代表赞同其观点和对其真实性负责,也无意构成任何其他引导。本号不对转载或发布的任何信息存在的不准确或错误,负任何直接或间接责任。

3、本号部分资料、素材、文字、图片等来源于互联网,所有转载都已经注明来源出处。如果您发现有侵犯您的知识产权以及个人合法权益的作品,请与我们取得联系,我们会及时修改或删除。

1 阅读:17

玩数据还有点懒

简介:感谢大家的关注