自从ChatGPT在2022年推出后,数据中心的爆炸性增长使这些能耗设施的环境影响成为焦点。

然而,我们不仅需要关注能源的使用,这些设施也可能消耗大量的水资源。

德州战略热能实验室(Strategic Thermal Labs)的奥斯汀.谢尔纳特(Austin Shelnutt)在今年秋季于亚特兰大举行的SC24会议中发布演示文稿指出,在美国,数据中心每天的用水量可能介于三十万到四百万加仑之间,才能保持内部运算设备的冷却。

我们稍后会再说明为何有些数据中心的用水量比其他数据中心更多,但在某些地区,数据中心的用水量高达该地区供水量的百分之二十五。

可以理解的是,这种程度的用水量引发了人们对水资源短缺和沙漠化的担忧,而这些问题原本就因为气候变迁而存在,生成式人工智能的普及更使情况雪上加霜。如今,用于训练这些模型的人工智能数据中心通常需要数万个GPU,每个GPU都能产生1,200瓦的功率和热量。

然而,未来几年内,超大规模数据中心、云计算服务提供商以及模型开发商计划部署数百万颗GPU和其他AI加速器,这需要千兆瓦级的能源,这也意味着水资源消耗将进一步增加。

根据加州大学河滨分校和德州大学阿灵顿分校的研究人员的说法,到2027年,全球人工智能需求每年可能导致42亿到66亿立方米的水资源消耗。这大约相当于英国一年用水量的一半。

然而,要减少数据中心的用水量,并不像舍弃蒸发式冷却塔、改用无水替代方案那么简单。

数据中心通过几种方式消耗水资源。其中之一是直接水资源消耗,这是我们将主要关注的部分。这些水资源来自当地水源,包括自来水和废水处理厂。

这些水被泵入冷却塔,在冷却塔中蒸发,将热量传递到空气中。如果你曾经使用过水冷式冷气来为你的家或公寓降温,冷却塔的工作原理也类似。

蒸发式冷却在数据中心运营商中很受欢迎,主要有几个原因,但最主要的原因是它们非常擅长散热,而且不需要消耗大量电力。

根据谢尔纳特的说法,每分钟蒸发10加仑的水足以冷却大约1.5兆瓦的运算设备。

当我们谈论“消耗”时,指的是被蒸发的水资源。它并未真正被消耗,而是通过气流从当地水系统中移除。这在干旱气候中可能成为问题,因为蒸发冷却在这些水资源匮乏的地区效果最佳。

根据研究人员的说法,进入冷却塔的水中,实际上大约有百分之七十到八十被消耗掉了,其余的水则是用于冲洗掉类似于清洁加湿器时会发现的矿物质沉积物。剩下的盐水会在系统中循环利用,直到其浓度超过一定程度,此时就会将其排放到现场或由当地市政当局运营的蓄水池或处理厂,然后再返回当地水系统。

要使这一过程顺利运行,废水处理厂需要具有足够的规模来处理数据中心产生的盐水量及其浓度。如果处理设施规模不够,问题就会变得非常复杂,就像微软在亚利桑那州古德伊尔(Goodyear)的数据中心曾遇到的情况那样。

数据中心运营商之所以偏爱蒸发式冷却器,原因之一是它们的运营成本比替代技术便宜得多。

谢尔纳特表示:“无论使用何种冷却介质,蒸发水的性能系数(COP)总是更高,这意味着需要的能量更少。”

他解释说,事实上,蒸发式冷却的COP(指每单位功率移除的热量)为1,230,而干式冷却器和冷水机的COP分别约为12和4。

就能源消耗而言,这使得采用蒸发式冷却的数据中心比不消耗水的数据中心更节能,这也意味着更低的运营成本。

然而,并非所有地点和气候都适合蒸发冷却。在水资源匮乏的炎热气候地区,或者蒸发冷却器无效的高湿度地区,可能会使用类似于空调系统的冷却器。

在北欧等较凉爽的气候中,数据中心通常会利用自然冷却和干式冷却器,这些冷却器利用较低的环境气温将热量排放到大气中,而不会消耗任何水。

数字不动产(Digital Realty)首席技术官克里斯·夏普(Chris Sharp)告诉说r,是否使用蒸发式冷却很大程度上取决于地点和气候。

“我们必须理解,水是一种稀缺资源,”他解释道。“每个人都必须从这个基点出发,确保对这种资源的有效利用。”

这家共置巨头在全球运营着三百多个数据中心,并根据预测的容量需求和环境因素采用各种设计。克里斯·夏普表示,该公司标准的数据中心设计根本不消耗任何水,而是依靠冷水机从设施中带走能量。然而,在某些地区,则会采用蒸发式冷却和干式冷却器。

虽然干式冷却器和冷水机可能不会在现场消耗水,但它们并非没有缺点。这些技术消耗了来自当地电网的大量电力,并可能导致更高的间接用水量。。

根据美国能源资讯局(US Energy Information Administration)的数据,美国约有89%的电力来自天然气、核能和燃煤发电厂。许多这些发电厂使用蒸汽涡轮来发电,而这个过程需要消耗大量的水。

讽刺的是,虽然蒸发式冷却器是数据中心消耗大量现场用水的原因,但同样的技术也常用于减少蒸汽带走的水量。尽管如此,通过能源生产消耗的水量还是远远超过现代数据中心的用水量。

根据劳伦斯伯克利国家实验室(Lawrence Berkeley National Lab, LBL)于2016年进行的一项研究,大约83%的数据中心用水量可归因于发电。因此,若以增加电力消耗为代价来减少现场用水,可能会导致总用水量的增加。

然而,加州大学河滨分校电机和计算机工程副教授任绍磊(Shaolei Ren)告诉说,发电厂的用水量可能比数据中心多,并不意味着它们取用的是相同的水源,并补充说许多发电厂的水源来自河流和湖泊等可能不适合数据中心的水源。

任绍磊(Ren)和他的团队一直在研究数据中心对用水量和空气品质的环境影响。

同样地,这也高度取决于地点和电网组合。例如,位于水力发电、太阳能或风力发电丰富地区的数据中心的间接用水量降低于以化石燃料或燃烧发电的数据中心。

我们知道,除了少数例外情况,数据中心总是会使用一定量的水,但运营商仍然有很多方法可以减少直接和间接的用水量。

最显而易见的一种方法是根据设施负载匹配水流速率,并在可能的情况下利用自然冷却。Digital Realty的首席技术官克里斯·夏普表示,通过结合传感器与软件自动化技术来监控使用蒸发式冷却的设施中的泵和过滤器,公司已观察到整体用水量减少了15%。

他说:“这相当于系统减少了约1.26亿加仑的水抽取量,因为我们运行得更加高效。”

此外,我们看到许多数据中心建造于较冷的气候地区,这些地区大部分时间可以利用自然冷却。更好的是,在许多北欧国家,大量的水力发电意味着即使需要辅助干冷器或冷水机组,间接用水量也不成问题。

我们也看到数据中心产生的热量被用于为当地办公室供暖、支持区域供热网络,甚至是为温室供暖,以便全年生产农产品。

在不适合自然冷却和热量再利用的地区,将人工智能集群的冷却方式转为直接芯片和浸没式液体冷却(DLC)(顺便一提,这是一个不真正消耗水的封闭回路),可以促进干式冷却器的使用。虽然干冷器的能耗仍高于蒸发式冷却器,但液冷技术显著降低的电源使用效率(Power Use Effectiveness, PUE)可能会弥补这一差距。

如果你不熟悉PUE,它指的是数据中心消耗的电力中有多少用于运算、存储或网络设备(即能创造收益的设备),而非冷却设施等无法产生收益的用途。PUE越接近1.0,设施的效率就越高。

这一点尤其因为空气冷却的AI系统中,约20%的能耗用于机箱风扇。此外,水的导热性能远高于空气。切换至DLC(例如Nvidia的高规Blackwell部分已开始应用这项技术),有可能将PUE从1.69-1.44降至约1.1或更低。

然而,正如谢尔纳特在他的SC24演示文稿中指出的那样,这种平衡很大程度上取决于DLC节省的电力是否会被重新分配以支持额外的运算。

虽然许多这些节水技术都需要改变设施基础设施才能实施,但另一种方法可能是改变工作负载在数据中心之间的分配方式。

任绍磊解释说,

这个想法与碳资源意识运算(Carbon-Aware Computing)类似,将工作负载根据电网碳强度和时间进行分配。“基于水资源压力等实时效率调整,也是可以做到的。毕竟,不同时的蒸发率会有变化,例如中午与晚上相比。”

他承认,云计算服务供应商和超大规模运算提供者可能更容易实现这一点,因为他们对基础设施的编排有更大的控制权。“相较之下,共享主机服务商受限于服务器与工作负载的有限控制,面临更多挑战。”

这种方法也可能不适用于对延迟敏感的工作负载,例如人工智能推论,因为接近用户对于即时数据处理至关重要。然而,像人工智能训练之类的工作负载没有这些限制。可以想象,一个可能需要执行数周或数月的人工智能训练工作负载,可以排队在位于极地地区的偏远数据中心中执行,该数据中心可以利用自然冷却。

微调工作负载(涉及改变预先训练模型的行为)的运算密集度要低得多。根据基础模型和所用数据集的大小,微调作业可能只需要几个小时即可完成。在这种情况下,可以将作业安排在夜间温度较低且蒸发掉的水较少时执行。

虽然数据中心的用水量仍然是一个令人担忧的问题,尤其是在干旱易发地区,但谢尔纳特认为更大的问题是这些设施使用的水来自哪里。

“地球上并不缺水。地球上缺乏的是某些地区的可饮用水,以及在部分地区存在的水分配短缺问题,”他说。

为解决这些问题,谢尔纳特建议数据中心运营商应该投资海水淡化厂、配水网络、内部污水处理设施和非饮用水存储设施,以支持更广泛地采用蒸发式冷却器。

虽然先淡化海水,然后通过渠道或火车运输的想法听起来成本高昂,但许多超大规模运算提供者已承诺在未来几年内投入数亿美元于场内核能供应。因此,投资于水的淡化与运输或许并非天方夜谭。

更重要的是,谢尔纳特声称,从海岸淡化和运输水的效率仍然高于使用干式冷却器或基于冷媒的冷却技术。

“目前海水淡化每立方米能耗3千瓦时——这是过去十年的平均值;许多海水淡化设施已将能耗降至每立方米1千瓦时以下——这相当于222的性能系数(COP),”他说。

经由渠道运输1,000英里后,COP降至132。若用火车运输,COP进一步降至38。这虽然远低于来自市政处理厂的蒸发式冷却用水,但仍比干冷器高效得多。