一项发表在《高性能计算、网络、存储与分析国际会议论文集》(Proceedings of the International Conference for High Performance Computing, Networking, Storage and Analysis)的新研究代表着在天体物理学、高性能计算(HPC)与人工智能交会的重大突破。研究团队首次成功完成一个前所未有的银河系模拟:在计算机中一颗一颗地关注超过1,000亿颗恒星,并演化1万年。这个结果靠的是AI与高性能数值模拟的结合,不只模拟的单颗恒星数量比以往最先进的模型多了约100倍,整体运算速度也快了100倍以上。

星系模拟面临的困境

天文学家长久以来都希望能有一个从一颗恒星出发的完整星系模拟。每一颗恒星都有独立的轨道与物理状态,可以直接对照银河系形成、结构、恒星演化的理论,甚至可以关注像生命形成所需的化学元素如何在银河系内诞生与分布这类问题。

但要做到这一点极为困难,因为银河演化涉及到许多彼此纠缠的物理过程,像是支配整个星系的结构与轨道运动的重力,描述星际介质的流动、压缩、冷却与加热的流体力学,超新星爆发时剧烈释放能量向外抛出气体与重元素。

更困难的是,这些过程都发生在差异极大的时间与空间尺度,星系的整个暗物质晕尺度达数十万光年,星际介质云与超新星爆发只有数十光年;一个星系盘面的旋转时间大约是1亿年,但一颗超新星爆炸时,早期几年的剧变对附近气体非常重要。要在同一个模拟中解析大尺度银河结构和小尺度的超新星爆发,就会面临时间步长(timestep)与分辨率的双重折磨。

星系中的物质循环过程。星系内部的稀薄暖气体会通过辐射与热传导持续损失能量,最终冷却并沉降成为盘状结构(星系盘)。在星系盘中,恒星主要诞生于由低温(约10K)分子氢组成的巨大冷气体。当质量约为太阳10倍左右的大质量恒星走到生命终点时,会爆发成为超新星,产生高达10⁷K的极端高温气体。超新星爆炸不仅向周围星际介质注入大量能量,也释放出像碳(C)、氧(O)、镁(Mg)与铁(Fe)等重元素,同时激发剧烈的湍流运动。这些物质部分会被超新星驱动的外流带离,最终再度落回星系盘,参与形成下一代恒星。经过多次循环累积,这些重元素最终孕育出像地球这样的行星系统,并促成生命的形成。(Source:ACM Digital Library,下同)

现有最顶尖的银河或宇宙学模拟虽然已经可以达到高精度,但仍然有限制。现有模型大多把整个星系的质量(约10¹²个太阳质量)切成模拟粒子,每一粒代表一整团恒星或气体,质量大约是100个太阳。换句话说,模拟中的一粒,在真实宇宙中其实是一大坨恒星与气体的统计平均,而不是单颗星体。这类模型可以研究星系形状怎么演化、大规模恒星形成区、气体外流等现象,但小尺度恒星分布演化属于次网格尺度,无法直接解析。若要以相同方法把质量分辨率提升到一颗恒星的等级,每模拟100万年演化要花约315小时,模拟10亿年则要超过36年。而且光靠堆栈更多运算核心并不现实,当核心数达到上百万颗时,通信成本与程序效率也会拖累整体并耗费大量能源。

目前先进模拟中,系统总质量与暗物质粒子(左)与气体粒子(右)的分辨率。图中的斜向虚线分别代表在整个系统中,粒子数为10⁶、10⁸、10¹⁰时的等值线。黑色实线则代表所谓的十亿粒子障壁(billion-particle barrier),即过去大部分传统模拟的可行上限,难以突破至更高的粒子数与分辨率。

让AI学习快转超新星

拖累整体模拟效率的是少数需要高分辨率的小区域,尤其是超新星爆发。研究团队因此研发出代理超新星局部的AI模型,每当一颗恒星即将成为超新星时,就在它周围取一个立方区域,把里面的气体粒子抽取出来。这一小块区域在AI模型中被存储成离散的网格,每个格点存放气体密度、温度、三维速度等物理量。

深度学习模型的任务是输入爆炸前的状态,直接预测10万年后的样子。预测完成后,再把那一小块区域放回主模拟里。而主体的银河模拟用传统N-body+SPH(平滑粒子流体力学)方法,固定使用一个较大的时间步长(例如2,000年),来演化整个银河系中3,000亿颗粒子。如此一来,主模拟就不用为了每一次超新星爆炸而把时间步长缩到几年甚至几个月。

高分辨率与高效率

这次的银河模拟总粒子数约3,000亿颗,恒星与气体每粒子约0.75个太阳质量,暗物质每粒子约6个太阳质量。对于恒星与气体来说,模拟中的一颗粒子几乎就可以当作单颗恒星或一小团云气来看,而不是一整团星团的平均。而要让3,000亿颗粒子互相感应重力与流体互动,自然需要超级计算机。计算使用了多套系统,其中主力是日本的超级计算机“富岳”(Fugaku),最多使用超过15万个节点(Arm A64FX CPU),总CPU核心数量达数百万级。在富岳上,每100万年演化需要2.78小时,要模拟完整的10亿年银河演化只需要约115天,比传统方法估计的36年少了两个数量级以上。

目前,这项研究工作主要是展示技术的里程碑,证明在技术上银河系级别、单颗恒星分辨率、含超新星反馈的模拟已经可以在合理的时间内完成。模拟出的银河在结构上呈现出有螺旋纹理的气体盘、有厚薄盘分化的恒星盘以及星际介质(冷、暖、热气体并存),真正天文物理的深入应用则还在探索中,并有望解答多尺度的空间与时间分布演化问题。

用深度学习(DL)代理模型的新模拟方案所生成的星系盘气体分布。右:星系盘的正面(face-on),即x–y平面,显示气体在盘面上的结构与旋臂分布。左:星系盘的侧面(edge-on),即x–z平面,显示盘厚度、中央突出结构(bulge)以及垂直方向的气体分层情形。

这项成果还有一层更广泛的应用。很多科学问题本质上都是多尺度、多物理,例如气候与海洋循环、天气预报、电浆物理与材料科学等等。对那些局部又剧烈的小尺度物理,先用高解析的专门模拟研究,再用深度学习训练代理模型,在大尺度主模拟中用“快转”方式嵌入,显示AI加速的模拟不再只是图样识别,而是能真正成为科学发现的工具。

(首图为示意图,来源:欧洲南方天文台)