甲骨文(Oracle)宣布推出首个Zettascale(十垓,10的21次方)级云计算集群,采英伟达(Nvidia Corp.)次世代“Blackwell”平台。与此同时,甲骨文并透露,已取得三座小型模块化反应炉(Small Modular Reactor,简称SMRs、小型核电厂)的建照,准备用来供应AI数据中心所需。

甲骨文11日发布新闻稿宣布,“甲骨文云计算基础架构”(Oracle Cloud Infrastructure,简称OCI)现在开始接受云计算大型AI超级计算机订单,能组建涵盖最多131,072颗Blackwell GPU的运算集群,峰值算力高达前所未见的2.4 zettaFLOPS。

甲骨文指出,OCI超级集群(OCI Supercluster)规模最大的款式,提供的绘图处理器(GPU)数量是Frontier超级计算机(配备37,888颗AMD Instinct MI250X GPU)的三倍以上,更是其他大型云计算服务商(Hyperscaler)的超过六倍。

OCI超级集群目前能供订购的OCI运算组态,有英伟达H100或H200 Tensor Core GPU、或英伟达Blackwell GPU可选。

其中,配备H100 GPU的OCI超级集群最多可拓展至16,384颗GPU、提供高达65 ExaFLOPS的算力和13Pb/s的总网络吞吐量。配备H200 GPU的OCI超级集群最多可拓展至65,536颗GPU、提供最多260 ExaFLOPS的算力和52Pb/s的总网络吞吐量,预计今年稍晚推出。

另外,配备英伟达GB200 NVL72液冷裸机服务器的OCI超级集群,将通过NVLink和NVLink Switch技术,让最多72颗Blackwell GPU以129.6 TB/s的总带宽在同一NVLink域内互联。英伟达Blackwell GPU预定2025年上半年供货。

值得注意的是,Tom's Hardware、The Register等外电报道,甲骨文创办人兼董事长、首席技术官Larry Ellison 9日在财报电话会议表示,已取得三座SMR建照,满足AI数据中心对电力的需求。

SMR是迷你版的核子反应炉,可以大量生产,不需要大型实体基础建设。理论上,SMR运营起来较不昂贵,但仍可产生数十至数百MW(百万瓦)的电力。不过,目前并无实际开始运行的SMR,试运营也不太顺利。

甲骨文希望拓展数据中心业务,对SMR相当感兴趣。Ellison 9日通过电话会议说,甲骨文在世界各地有162座云计算数据中心,有些已开始运行、有些还在建造中。其中规模最大者为800 MW,配备许多英伟达GPU集群,能够训练全球规模最大的AI模型。Ellison并表示,甲骨文很快就能建造规模超过1 GW的数据中心。

(首图来源:Oracle)