在2025年Hot Chips大会上,科技媒体WccfTech报道称,谷歌正式揭开了其第七代TPU架构”Ironwood”超级计算平台的神秘面纱。
据了解,谷歌在今年4月就已官宣Ironwood架构,该平台号称性能比现有最强超级计算机高出24倍。
在硬件规格方面,Ironwood较前几代产品有了显著提升。与2022年的TPU v4(4096芯片、32GB HBM、275 TFLOPs)和2023年的TPU v5p(8960芯片、95GB HBM、459 TFLOPs)相比,Ironwood在核心性能上实现了质的飞跃。
具体而言,单个Ironwood Superpod集成了9216枚定制芯片,每片芯片配备192GB高带宽存储(7.4TB/s),峰值算力达到惊人的4614 TFLOPs。这意味着其单芯片性能较TPU v4提升了超过16倍。
在系统架构设计上,Ironwood采用模块化构建方式:每四颗芯片组成一块PCBA主板,16块主板构成一个机架(共64个芯片节点)。谷歌创新性地运用InterChip Interconnect(ICI)技术,将多达43个独立的64芯片模块高效互连,最终形成一个拥有1.8PB/s网络带宽的超级集群。
在物理布局方面,Ironwood延续了过去三代的3D Torus(立方环网)拓扑结构。每个逻辑单元由一个4×4×4节点阵列组成,即64个芯片封装在一个机架中。
每个Superpod包含144个机架,并配备光学交换机机箱用于跨模块互连,同时配置了液冷系统的冷却分配单元(CBU)机架。在互连方式上,Ironwood采用PCB走线、铜缆和光纤的混合方案,极大提升了系统的灵活性与可扩展性。
在硬件设计方面,顶部设有泄漏检测盘用于监控液冷系统运行状态,底部是供电模块,提供双电源域支持(416V交流电转直流电)。整个系统采用液冷散热方案,满载功率超过100kW。
为了帮助读者更好地理解文中涉及的技术术语,以下是一些关键概念的解释:
- TPU(Tensor Processing Unit)张量处理单元:专为机器学习和人工智能任务设计的加速器。
- Superpod:超级计算集群的基本构建模块。
- HBM(High Bandwidth Memory)高带宽内存:一种集成在芯片附近的高速缓存存储技术,显著提升数据传输速率。
- TFLOPs(Tera Floating Point Operations per Second)万亿次浮点运算/秒:衡量计算机浮点计算性能的指标单位。
通过这些创新设计和技术突破,Ironwood超级计算平台将为AI训练和推理提供前所未有的算力支持,推动人工智能技术的发展迈上新台阶。