微软近来正式披露其AI基础建设新战略,宣布已激活数座新一代Fairwater架构数据中心,并通过高速专用网络互相串联,组成一座分布式的“AI超级工厂”(AI Superfactory)。这项超大型基础设施象征着微软扩大AI模型训练能力与云计算规模的重大里程碑。

根据微软官方博客说法,目前已投入运行的两座Fairwater数据中心分别位于美国威斯康星州的Mt Pleasant和乔治亚州的亚特兰大,采双层设计,机架搭载NVIDIA最新的GB200 NVL72,并具备近乎零耗水的液冷散热系统,有效强化能源效率与环保性能。

更令人瞩目的是,这些数据中心不再只是独立节点,而是通过一套全新设计的AI WAN(专用广域网络)相互联接,仿佛组成一座虚拟的超级计算机。整体系统集成了数十万颗先进GPU、EB级(Exabyte)存储空间与数百万个CPU核心,能支持训练上千亿参数的大型AI模型,是微软推进AI战略的核心动力。

传统上,大型语言模型(LLM)或多模态AI训练会受到单一数据中心计算资源与带宽的限制。但通过AI超级工厂的分布式设计,微软得以将工作负载分配至多个站点,同步进行训练与推论作业,大幅提升效率并降低延迟,进而加速模型的开发与部署。

这也意味着未来微软Azure云计算平台在面对企业级AI应用,如企业聊天机器人、自动程序生成、多语言模型服务等场景时,能提供更具弹性与扩展性的后端支持。

微软这项布局也与其他科技巨头如Google、亚马逊AWS、Meta等竞争策略互相呼应,后者同样大力投入自建数据中心、定制AI芯片、升级网络骨干等工程,意图抢下下一波AI增长红利。

先前就有报道指出,微软在美国多地投资兴建新电厂与扩建变电站,以解决AI训练导致的用电高峰。而数据中心“用水量”与“碳排放”问题,也成为监管机关关注焦点,推动企业在基础设施设计上朝更高能源效率迈进。