气象超算跟踪系列(七)JMA's HPC
02/02
本文最后更新于
2024年02月02日,已超过
393天没有更新。如果文章内容或图片资源失效,请留言反馈,我会及时处理,谢谢!
本文信息来自TOYODA Eizi的报告"Updates of HPC in JMA"。
JMA(Japan Meteorological Agency)计划2024年3月升级HPCF(High Performance Computing Facilities),预期实际性能提升4倍。
JMA的高性能计算机以NAPS(Numerical Analysis and Prediction System)命名,目前是第10代,即NAPS10。之前的NAPS供应商为日立(Hitachi),而新一代NAPS第一次采购自富士通(Fujitsu)。
NAPS10是在2018年6月投入业务使用,是两台Cray XC50集群,每个集群浮点计算峰值性能为9.13Petaflop/s。
新一代NAPS11分两个阶段部署:第一阶段是NAPS11s,其处理器是A64fx架构(与富岳Fugaku超算相同架构),该集群专门用于中尺度模式。第二阶段的NAPS11则是x86_64架构,用于其它业务模式。
集群 | NAPS11s | NAPS 11 |
---|---|---|
业务使用时间 | 2023.3 | 2024.3 |
处理器架构 | A64fx | x86_64 |
内存 | HBM2 | HBM2 |
浮点峰值性能(Petaflop/s) | 15.57 | ? |
GPU节点 | 无 | 有 |
NAPS11集群包含两个子系统,同时含GPU节点。这是JMA NAPS第一次引入GPU节点,主要用于后处理机器学习和全球模式GSM(Global Spectral Model)异构计算研发。
A64fx架构处理器采用的向量指令集SVE可以见前面的文章介绍。
JMA模式升级计划
下图是JMA现有主要业务模式情况。
JMA模式升级计划:
- 1公里Local Forecast Model(LFM)
- Local Ensemble Prediction System(LEPS) (2km / 101 Members)
- 10km GSM (需要关注计算性能)
Remarks
- 目前模式只是移植到新的架构平台,但还需要深入优化充分利用新架构平台计算能力,包括对SIMD向量化和HBM2高带宽内存的利用。
- JMA期望HBM2的使用能够获得两倍的实际性能提升。
参考资料
https://ecmwfevents.com/assets/presentations/hpcws2023-toyoda1697182153.pdf

