马斯克”巨硬计划”:6个月打造算力集群,超越OpenAI 15个月成绩

AI资讯2个月前发布 ainav
66 0

马斯克的“巨硬计划”(MACROHARD)近期曝出重大进展:仅用6个月时间就从零开始打造了一个算力集群,完成了200MW的供电规模,足以支持11万台英伟达GB200 GPU NVL72运行。

更令人惊叹的是,马斯克团队在短短6个月内完成的工作量,相当于OpenAI和甲骨文等公司耗时15个月才能达成的任务。这一速度再次刷新了行业纪录。

值得注意的是,马斯克在回应网友提问时透露,备受关注的Colossus II算力集群正是“巨硬计划”的一部分。

马斯克

尽管“巨硬”这个名称带有对微软的调侃意味,但马斯克对此项目却是极其认真。事实上,这一构想最早可以追溯到2021年。

马斯克

“巨硬”的核心理念是:既然软件公司不生产实体硬件,那么从编码、设计、测试到管理的完整流程理论上都可以被AI技术所取代。

马斯克还透露,“巨硬”将基于xAI的大语言模型Grok构建一个多智能体系统。该系统将部署数百个专门的AI智能体,每个智能体分别专注于不同的任务:有的负责编码,有的擅长图像视频生成,还有些则专注于软件测试。

这些AI智能体会协同工作,共同模拟一个完整的软件开发团队。此外,系统还会在虚拟机中模拟人类用户与正在开发的软件进行交互,通过持续的迭代和反馈来优化产品。

整个软件开发生命周期——从需求分析、产品设计、编码实现,到质量保证和用户测试——都将由AI智能体自动完成。

史无前例的算力巨兽

大家对xAI的Colossus I集群应该并不陌生。这个仅用122天就建成、拥有约20万台H200 GPU的算力集群,随后又在92天内将规模翻倍至40万台GPU。

截至今日,Colossus I依然是全球范围内规模最大的AI训练算力集群。

马斯克

如今,马斯克正在将“第一性原理”的成功经验应用到Colossus II项目中,并计划将其规模扩大数十倍,这次的重点是AI推理。

Colossus II于2025年3月7日启动。当时,xAI在孟菲斯收购了一座100万平方英尺的仓库和两块相邻地块,总面积达100英亩。

到7月份,部分机架已经开始安装。截至8月22日,现场已经部署了119台风冷式冷水机组,提供约200MW的冷却能力,足以支持11万个GB200 NVL72 GPU运行。

按照规划,Colossus II第一阶段将部署11万个英伟达GB200 GPU,最终目标是超过55万个GPU,预计峰值功率需求将超过1.1吉瓦。更长远的路线图甚至计划将GPU总量扩展至100万个。

为了解决巨大的电力需求,xAI采用了跨区域能源策略。由于在孟菲斯当地获取吉瓦级电力面临阻力,xAI干脆在州界对面的密西西比州收购了一座前杜克能源的发电厂。

特斯拉已将自身定位为“AI机器人公司”,未来80%的价值可能都将来自机器人领域。巨硬开发的AI软件不仅能够优化特斯拉的自动驾驶算法、工厂自动化流程,还能提升人形机器人Optimus的功能表现。反过来,特斯拉海量的真实世界数据也将为巨硬提供宝贵的训练素材。

可以看出,“巨硬”已经成为马斯克商业版图中的关键一环。

参考链接:

  • [1]https://x.com/elonmusk/status/1967800687431127265

  • [2]https://semianalysis.com/2025/09/16/xais-colossus-2-first-gigawatt-datacenter/

本文来自微信公众号:量子位(ID:QbitAI),作者:梦晨

© 版权声明

相关文章