IBM与NASA共同发布Surya,这是一款针对太阳圈物理(Heliophysics)研究设计的开源人工智能基础模型,现已在Hugging Face平台公开。该模型能处理高分辨率的太阳观测数据,并应用于太阳风暴等太空天气的预测。研究团队同时发布经整理的太阳圈物理数据集,提供学术界与产业界作为进一步研究与应用的基础。
Surya的训练数据来自NASA太阳动力学观测台(SDO)长达9年的高解析太阳形象,这些形象文件尺寸比一般人工智能训练数据大上十倍,研究团队因此采取多架构解决方案,以兼顾庞大数据处理与运算效率。模型支持多项太阳圈物理研究任务,包括太阳闪焰(耀斑)分类、太阳风速推测估计、EUV光谱预测以及活跃区域的出现分析。
在初步测试中,Surya在闪焰二元分类的准确率较既有方法提升约16%。此外,模型首次尝试以形象形式标示闪焰可能发生的位置,最长可提前两小时进行可视化预测,对于需要即时反应的航天、电信与电力基础设施而言,具备实际应用价值。目前数据还属研究性质,后续仍需通过更多实际案例与数据加以验证。
与Surya同步发布的SuryaBench数据集涵盖多个子领域,包括闪焰预测、太阳风、日冕外推(Coronal Extrapolation)、活跃区域分割与活跃区域出现,并提供SDO_training作为通用训练集。部分数据集的时间范围涵盖2011年至2024年,以HDF5格式存放,单张分辨率最高达4096×4096,适合高精度特征学习与基准测试。
可靠的太阳天气预测对现代基础设施安全至关重要,强烈太阳活动可能影响卫星运行、航天任务、电网稳定度与通信系统的可用性,甚至干扰GPS定位与航空导航。随着人工智能模型与开源数据集的发布,研究人员与产业开发者可以在Hugging Face上直接访问并针对特定应用进行微调,构建符合需求的监测与预警系统。
这项发布是IBM与NASA长期合作计划的一部分,双方先前已共同发布涵盖气候与天气领域的Prithvi系列基础模型,而Surya则将人工智能应用范畴扩展至太阳圈物理,进一步展现人工智能在太空天气研究中的可能性。