AWS 2024年度re:Invent会议在美国拉斯维加斯举行,席间隆重宣布数据中心组件将会升级,结合了电源、冷却和硬件设计方面的创新,令可用性和效率都大大提升。大会宣布的新数据中心组件,旨在支持新一代AI创新和客户与日俱增的需求。AWS基础设施服务副总裁Prasad Kalyanaraman表示:“这些数据中心功能代表着进一步提高能源效率和灵活支持新兴工作负载。”
时至今日,AWS的数据中心支持全球数百万活跃客户,包括使用AWS AI和机器学习服务的客户。AWS数据中心正支持更高的功率密度,以应对需求。而数据中心设计改进包括简化电力分配和机械系统,使基础设施可用性达到99.9%。系统经简化后,机架可因电力问题受影响的机会便减少了89%。
数据中心的电力在到达IT设备之前要经过多次转换和分配系统,每个步骤都自然有机会故障。新设计简化了电力分配,从而将潜在故障点的数量减少了20%。简化又包括将备用电源带到机架附近,减少使用散热风扇。AWS利用自然压力差来排出热量,改善了可用于服务器的电量。以上变化都有助减少耗电,同时最小化故障风险。
AWS创建了一系列新的和增强的功能,为客户提供最高性能、可用性和能源效率的基础设施。其中包括液体冷却技术,新一代AI服务器受益于液体冷却,以更有效地冷却高密度运算芯片。AWS开发了创新的机械冷却解决方案,在新建和现有数据中心中提供可配置的液体到芯片冷却。某些AWS技术利用无需液体冷却的网络和存储基础设施,因此更新的冷却系统将无缝结合空气和液体冷却功能,以满足最强大的AI芯片组(如AWS Trainium2)以及AWS的网络交换机和存储服务器的需求。这种灵活的多模式冷却设计令AWS能以最低成本提供最大的性能和效率,加快AI工作负载的上市时间。
AWS又通过改善机架在数据中心的位置来提升功率使用,减少闲置电力。这种设计为AI工作负载提供所需的新一代硬件和高密度机架。此外,AWS还改善了电源传输系统,令未来两年内支持机架功率密度增加6倍,并在未来再增加3倍。部分得益于新的电源架,它能够有效地将数据中心电力传遍整个机架,减少电力转换损失。这些创新使AWS能够为客户工作负载提供再多12%的运算能力,同时减少实现相同运算能力所需的数据中心数量。
据研究估计,AWS的基础设施目前的效率最高可达自建基础设施的4.1倍,当工作负载在AWS上得到改善时,相关碳足迹可减少高达99%。AWS的新组件在能源效率和可持续性都有所提升,包括更高效的冷却系统,在每兆瓦用水量不增加的情况下,机械能源消耗减少高达46%。另外,AWS采用了低碳钢和混凝土,并改善结构设计以减少使用钢材。这使数据中心建筑物外壳混凝土中的隐含碳,与行业平均水平相比减少高达35%。同时,数据中心的备用发电机将能够使用可再生柴油,相比化石柴油,其全生命周期的温室气体排放量可减少高达90%。AWS也已开始在欧美现有数据中心的备用发电机转用可再生柴油。
新数据中心组件将在全球范围内扩展到AWS的所有基础设施。预计于2025年初,美国将率先建设具有完整组件组件的新AWS数据中心。