谷歌第七代 TPU 架构 Superpod 曝光：9216 芯片+192GB HBM

106 0 0

在2025年Hot Chips大会上，科技媒体WccfTech报道称，谷歌正式揭开了其第七代TPU架构”Ironwood”超级计算平台的神秘面纱。

据了解，谷歌在今年4月就已官宣Ironwood架构，该平台号称性能比现有最强超级计算机高出24倍。

在硬件规格方面，Ironwood较前几代产品有了显著提升。与2022年的TPU v4（4096芯片、32GB HBM、275 TFLOPs）和2023年的TPU v5p（8960芯片、95GB HBM、459 TFLOPs）相比，Ironwood在核心性能上实现了质的飞跃。

具体而言，单个Ironwood Superpod集成了9216枚定制芯片，每片芯片配备192GB高带宽存储（7.4TB/s），峰值算力达到惊人的4614 TFLOPs。这意味着其单芯片性能较TPU v4提升了超过16倍。

在系统架构设计上，Ironwood采用模块化构建方式：每四颗芯片组成一块PCBA主板，16块主板构成一个机架（共64个芯片节点）。谷歌创新性地运用InterChip Interconnect（ICI）技术，将多达43个独立的64芯片模块高效互连，最终形成一个拥有1.8PB/s网络带宽的超级集群。

在物理布局方面，Ironwood延续了过去三代的3D Torus（立方环网）拓扑结构。每个逻辑单元由一个4×4×4节点阵列组成，即64个芯片封装在一个机架中。

每个Superpod包含144个机架，并配备光学交换机机箱用于跨模块互连，同时配置了液冷系统的冷却分配单元（CBU）机架。在互连方式上，Ironwood采用PCB走线、铜缆和光纤的混合方案，极大提升了系统的灵活性与可扩展性。

在硬件设计方面，顶部设有泄漏检测盘用于监控液冷系统运行状态，底部是供电模块，提供双电源域支持（416V交流电转直流电）。整个系统采用液冷散热方案，满载功率超过100kW。

为了帮助读者更好地理解文中涉及的技术术语，以下是一些关键概念的解释：

TPU（Tensor Processing Unit）张量处理单元：专为机器学习和人工智能任务设计的加速器。
Superpod：超级计算集群的基本构建模块。
HBM（High Bandwidth Memory）高带宽内存：一种集成在芯片附近的高速缓存存储技术，显著提升数据传输速率。
TFLOPs（Tera Floating Point Operations per Second）万亿次浮点运算/秒：衡量计算机浮点计算性能的指标单位。

通过这些创新设计和技术突破，Ironwood超级计算平台将为AI训练和推理提供前所未有的算力支持，推动人工智能技术的发展迈上新台阶。