TypechoJoeTheme

MetMan's Blog

网站页面
搜索到 1 篇与 的结果 ———
2025-03-22

CAMx平流模块GPU HIP移植优化

CAMx平流模块GPU HIP移植优化
Cao et al.(2024)发表了空气质量模型CAMx模式PPM(Piecewise Parabolic Method)平流模块在国产GPU加速器上使用HIP编程接口移植优化工作,是Cao et al.(2023) CUDA C优化工作的后续。硬件和编程模型文中所述的国产GPU加速器估计是曙光的DCU加速器。试验平台包括NVIDIA GPU和国产GPU,软硬件配置见下图国产GPU的显存是16GB的HBM2。Songshan超算和Taiyuan超算的国产GPU通过PCIe与CPU连接,主存和显存之间的数据传输峰值带宽分别为16GB/s和32GB/s。ROCm-HIP是AMD为其GPU设备开发的编程接口,对标NVIDIA的CUDA。两者使用非常类似,大多数情况下cuda c API接口cuda前缀替换为hip即可适用于AMD GPU。因此,有一个perl脚本工具HIPIFY可以将cuda c程序转换成hip程序。国产GPU只能使用HIP,不能使用CUDA。异构实现路线CAMx模式由Fortran语言编写,支持MPI+OpenMP。为了能够在GPU平台运行,需要先将其改写为C代码,...
2025年03月22日
14 阅读
0 评论

互动读者

标签云

最新回复

  1. tqymnonccc打酱油
    2024-09-27
  2. toibdpojay打酱油
    2024-09-22
  3. yvctxyevvw打酱油
    2024-09-22
  4. frezhwzwuq打酱油
    2024-09-22
登录
X
用户名
密码