马斯克巨硬计划新动作曝光!6个月建起算力集群,仅用6个月完成

admin

马斯克“巨硬计划”(MACROHARD)新动作曝光:

搭建算力集群耗时半载,现已具备二百兆瓦供电能力,能够满足十一万台英伟达GB200 GPU NVL72的运行需求。

仅六个月,就达成了 OpenAI 与甲骨文等伙伴合作耗时十五个月才取得的成果,又一次刷新了纪录。

马斯克在回应网友询问时,表示 Colossus II 算力中心,是与微软达成了合作意向。

那个名称看似在嘲讽微软,但马斯克对此事态度严肃,并且早在 2021 年便已萌生此念。

其中心思想在于:软件企业并不制造实体设备,因此从编程、构思、验证到统筹的全部环节,原则上能够被人工智能加以模仿。

微软计划运用 xAI 的巨型语言模型 Grok来打造一个由众多智能体组成的系统。据马斯克披露,该计划将配置数百个功能各异的智能体,部分专门从事编程工作,部分致力于图像和视频内容的创作,还有部分专注于软件质量检测。这些智能体将彼此配合,共同模拟出一个完整的软件开发团队的工作流程。

系统还会以虚拟环境模拟人类用户与开发中的软件互动,借助反复的优化和调整来完善产品,整个软件制作流程,包括从需求调研、方案构思、代码编写,直至品质控制和用户验证,都将由人工智能代理自主执行。

要让数百个结构繁复的人工智能代理协同运作,并开展范围广阔的软件试验,没有极其强大的计算能力是无法完成的。

Colossus II 正是为此存在。

史无前例的算力巨兽

对于 xAI 的 Colossus I 项目,公众已相当了解,该设施仅耗时 122 天便完成了大约 20 万台 H200 GPU 算力集群的建设,紧接着在 92 天之内,其规模实现了增长一倍。

Colossus I 仍然作为规模最大的 AI 训练算力集群而存在。

马斯克“巨硬计划”新动作曝光:从 0 建起算力集群,6 个月完成 OpenAI & 甲骨文 15 个月的工作_马斯克“巨硬计划”新动作曝光:从 0 建起算力集群,6 个月完成 OpenAI & 甲骨文 15 个月的工作_

马斯克正在运用“第一性原理”,将成功经验转移到 Colossus II 上,规模比原先扩大了数十倍,此次目的是为了 AI 推理。

Colossus II 项目于 2025 年 3 月 7 日启动,当时 xAI 在孟菲斯购置了一处 100 万平方英尺的仓库,同时购入了两个相连的地块,这两块地加起来的面积总共是 100 英亩。

马斯克在 7 月份表示,部分机架已经开始安装。

截止到 8 月 22 日,现场已经安装了 119 台制冷型冷水机组,能够提供大约 200MW 的制冷功率,这个制冷功率足以满足大约 11 万个 GB200 NVL72 GPU 的散热需求。

根据计划,Colossus II 的初始建设会安装十一万个英伟达 GB200 显卡,其长远打算是要达到五十五万个显卡以上,整个系统运行时所需的最高能量消耗估计会超过一点一吉瓦。

未来规划打算把 GPU 的整体数量提升到一百万个。

为解决巨大的电力需求,xAI 采用了跨区域能源策略。

孟菲斯本地获取吉瓦级电力遇到阻碍,xAI 就在邻近州界的密西西比州购置了原先杜克能源拥有的发电设施。当地监管单位临时准许 xAI 在该地点使用燃气轮机持续十二个月,暂时无需申请正式执照。现阶段,该发电站已有七台功率为三十五兆瓦的涡轮机组投入运作。

为了提升部署效率, xAI 使用了租赁的燃气涡轮设备。Solaris Energy Infrastructure(SEI)作为供应商,控制着 600MW 的燃气涡轮机组。目前,其中 400MW 被用于支持 xAI 的运营,这一比例达到了 67%。Solaris 与 xAI 联合创办的企业,Solaris 拥有 50.1% 的股份,xAI 拥有 49.9% 的股份,这家公司于 2025 年第二季度已经动用了 1.12 亿美元的资金进行投资,这笔支出用于资本项目。

为了防止对本地电力系统产生干扰,xAI 在 Colossus II 地点设置了 168 套特斯拉 Megapack 大容量储能装置,在用电需求旺盛时段给予电力补充,以此保障当地民众不会经历断电状况。

马斯克亲自督战,项目进入冲刺阶段

就在昨天,马斯克晒出一份疯狂的工作日程表:

可以看出,巨硬已经成为马斯克商业版图中的关键一环。

特斯拉将自己称作人工智能机械制造商,将来其价值的百分之八十将体现在机械人身上,微软研发的人工智能系统有助于改善特斯拉的无人驾驶技术、生产线智能化以及仿生机械人奥密克戎的性能,同时特斯拉庞大的现实世界信息能够为微软带来极其有价值的模拟素材

参考链接: