TypechoJoeTheme

MetMan's Blog

网站页面

气象超算跟踪系列(五)UKMO's HPC

MetMan博 主
2023-10-21
/
0 评论
/
223 阅读
/
759 个字
/
百度已收录
10/21
本文最后更新于 2023年10月21日,已超过 334天没有更新。如果文章内容或图片资源失效,请留言反馈,我会及时处理,谢谢!

当初看到微软(Microsoft)中标英国气象局(UKMO)超算合同,说实话我是一脸懵的。

微软虽然是云计算一方豪强,但啥时候掺和进传统高性能计算这个小众领域的?

据网上查到的消息,微软中标UKMO一份长达10年的合同,价值10亿英镑,合同约定将提供60 Petaflops计算能力。新系统将安装在微软Azure云计算平台中,并将集成HPE Cray EX超级计算机,以及微软高性能活动数据存档系统和其他Azure云技术,以及端到端托管服务。

UKMO预计,该系统将取代Cray HPC系统,将使该组织的计算能力提高6倍,并将成为世界上25台最强大的超级计算机之一。新超算使用四个子系统,增加使用弹性、故障备份。四台系统首次异地托管。具体的硬件配置细节还不清楚。

UKMO对选择微软作为合作伙伴有如下考虑:

  • 超算建设周期长,从提出需求、撰写标书、招标采购、搭建HPC、测试运行一系列流程走下来,可能需要几年时间,而高性能计算硬件更新迭代非常快。UKMO介绍它们平均需要大约两年的时间才能购买新的超级计算机,然后再花一年时间才能投入运行。UKMO希望改变这种模式,使其在采购方面花费时间更少,使用时间更多。
  • 气象数值业务中心一般选择自建超算中心,自己运维管理。但UKMO认为气象局不需要将自己变成超算中心,理念转变为HPC-as-a-service,获得满足业务研发需求的超算功能,而不需要自己负责建设、运营超算。
  • 长期服务合同可以使UKMO在服务期间获得更新的超算服务。

UKMO对超算采购的理念值得思考,更加聚焦获得高性能计算机提供的计算服务,而不用操心超算中心建设、运行维护、超算支撑人员管理等。云计算厂商在这些方面具有丰富的经验和强大的技术支持。但不确定的是一旦合同到期后,如需更换服务商是否能丝滑过渡?

幕后花絮

当时参与UKMO超算合同投标的还有一家欧洲(法国)性能计算机公司Atos,不幸投标失败了。据英国《金融时报》报道,Atos指控英国政府错误地拒绝了阿托斯的投标,因为阿托斯提议的研发系统使用的处理器与主系统不同。有争议的是UKMO要求主系统和开发系统在 "架构上是等同的"。

Atos因此将英国气象局告上法庭,最终英国政府向Atos支付2400万英镑和解金。

注:英国气象局(Met Office)之前运行三台Cray XC40超算,每台7 Petaflops,两台主要用于业务预报,互为备份,第三台用于研发。

参考资料

Atos Wins £24M Settlement over UK Met Office Weather Supercomputer Contract - High-Performance Computing News Analysis | insideHPC

Behind the Met Office's Procurement of a Billion-Dollar Microsoft System (hpcwire.com)

朗读
赞(0)
赞赏
感谢您的支持,我会继续努力哒!
版权属于:

MetMan's Blog

本文链接:

https://blog.metman.top/index.php/archives/38/(转载时请注明本文出处及文章链接)

评论 (0)

互动读者

标签云

最新回复

暂无回复

登录
X
用户名
密码