TypechoJoeTheme

MetMan's Blog

网站页面

最新文章

2023-10-21

Typecho博客网格

置顶
Typecho博客网格
基于油管视频搭建个人Typecho博客网站。视频对应文字介绍:https://iweec.com/336.htmlVPS目前使用Racknerd VPS。主题主题不使用视频中提供的版本,而是使用joe魔改版1.1.9,主题下载地址:https://github.com/XG2020/Typecho-Joe-Theme。侧边栏广告位图片适配图片分辨率调整设置广告位高度为90px (原先190px)usr/themes/Typecho-Joe-Theme/assets/css/joe.min.css外链图片不能正常显示在控制台->外观->设置外观->公共设置中“自定义head标签末尾位置内容”中添加<meta name="referrer" content="no-referrer" /> 插件代码高亮试用了CodeStyle和ColorHighlight插件发现与现在的主题不适配,最终选择了SyntaxHighlighter这款插件。插件地址:https://github.com/tinpont/SyntaxHi...
2023年10月21日
29,958 阅读
1 评论
2025-03-22

有意思的视频编码

有意思的视频编码
影视飓风发布的一条视频“技术进步了,画质怎么变差了?”遭全网下架,视频内容揭露了各大视频平台为了节省成本采用的种种技术手段,很有意思,被科普了。视频平台通过编码压缩视频码率,码率意味着视频质量,ChatGPT对其解释是:视频码率(Bitrate)指的是视频数据在单位时间内的传输速率或压缩率,通常以每秒传输的比特数(bps)表示。它表示了视频文件的数据量和质量。 视频码率决定了视频文件的大小和清晰度。较高的码率意味着更多的数据被分配给视频,从而提供更高的清晰度和更好的图像质量,但同时也会导致文件大小增加。较低的码率则会减小文件大小,但可能会导致视频质量下降和图像细节损失。编码算法很有意思,比如H.264,帧内压缩处理方法让我联想到地学中陆面模式对下垫面处理方式,将地表类型分为不同类目(沙漠、海洋、农地等等),对于地表均一的网格,使用较少的次网格patch类型描述,而对于复杂地表的网格,使用更多的次网格patch数目描述。帧间压缩比较前后帧,对于静止背景和环境只记录一次,保存运动部分。影视飓风B站地址:https://space.bilibili.com/946974
2025年03月22日
13 阅读
0 评论
2025-03-22

使用ECMWF开放数据运行AI模型

使用ECMWF开放数据运行AI模型
ECMWF宣布用户可以使用ECMWF开放数据运行AI模型。从ECWMF官方文章介绍来看,在本地运行气象大模型步骤已经非常简单了。 目前支持的大模型包括:Pangu-WeatherFourCastNet(versions 1 and 2)GraphCastFuXiAurora暂未提供ECMWF自研的AIFS大模型。使用方法系统必须安装python、pip (推荐mambaforge或miniconda)$ pip install ai-models $ pip install ai-models-panguweather # Or another model $ ai-models panguweather --input ecmwf-open-data执行第三条命令报错,提示没有训练好的模型文件。按照提示执行命令ai-models --download-assets panguweather --input ecmwf-open-data会下载数据到pangu_weather_24.onnx和pangu_weather_6.onnx文件。然后再次执行命令ai-model...
2025年03月22日
10 阅读
0 评论
2025-03-22

US NAVY下一代模式NEPTUNE进展跟踪

US NAVY下一代模式NEPTUNE进展跟踪
网上冲浪的时候看到一份美国海军NRL(Naval Research Laboratory)实验室为其下一代模式NEPTUNE(Navy Environmental Prediction sysTem Utilizing a Nonhydrostatic Engine)公开招标的文件内容,UCAR作为其独家供货商。通过这份公开文件可以研究美国海军下一代模式NEPTUNE的技术选型。NEPTUNE系统组件包括:动力核心NUMA物理过程套件CCPP同化系统JEDI (支持4D变分系统)评估软件METplusCMake构建系统关注点:为了支持4D变分同化系统,必须更新模式部分对应的切线性(TLM)和伴随(Adjoint)模式。NEPTUNE计算效率优化,Intel oneAPI编译器支持以及I/O优化耦合物理套件CCPPv7.0信息源https://www.highergov.com/contract-opportunity/research-and-development-r-d-of-the-u-s-navys-n0017324qcm02-s-29a68/附动力框架和物理过程开发内容:
2025年03月22日
10 阅读
0 评论
2025-03-22

Ubuntu on WSL安装作业调度器Slurm

Ubuntu on WSL安装作业调度器Slurm
前言Slurm是高性能计算机上使用最广泛的作业资源调度器,它能够管理多节点CPU计算资源,也支持管理GPU计算资源。下面介绍单节点部署slurm的方法,通过slurm管理小型工作站计算资源。单节点安装相比集群安装简化很多步骤。测试环境工作站:12核24线程 CPU,1块NVIDIA RTX 3060 GPU。Ubuntu 24.04 LTS @WSLslurm-wlm 23.11.4安装这里通过Ubuntu apt包管理器安装slurm,相比源代码安装简单方便。安装slurm及依赖munge$ sudo apt install munge slurm-wlm查询节点信息,后续slurm配置需要$ hostname $ slurmd -C配置slurm.conf文件slurm提供了网页版生成配置信息的方法,只需要填入对应的参数,就能一键生成配置信息。使用浏览器打开/usr/share/doc/slurmctld/slurm-wlm-configurator.easy.html(WSL中可以利用wslview调用Windows的浏览器打开网页或者拷贝这个文件到Windows中打开)...
2025年03月22日
12 阅读
0 评论
2025-03-22

国际气候超算峰会

国际气候超算峰会
美国国家超级计算应用中心(National Center for Supercomputing Applications, NCSA)和伊利诺伊大学的气候、气象和大气科学系(CliMAS)将于2024年9月29日-10月2日在伊利诺伊大学厄巴纳-香槟分校举行的国际气候超算峰会。会议信息网址:https://climatecomputer.ncsa.illinois.edu/气候科学的一个关键目标是在公里级全球分辨率下利用尖端的地球系统模式(ESMs)。实现这一重要目标需要的计算能力和软件框架目前还不能提供。该峰会旨在通过召集来自多个行业的国际专家组来应对这一挑战,以研究共同设计一个专门的计算系统和建模框架的可行性,以支持使用公里级全球分辨率进行前沿地球系统科学研究和气候预测。峰会还将讨论如何在决策中使用全球高分辨率气候预测的输出——尤其是在区域范围内。除了线下参会方式,峰会还将通过YOUTUBE线上直播所有会议,可以通过以下链接注册虚拟参会。https://climatecomputer.ncsa.illinois.edu/attend-virtually/
2025年03月22日
11 阅读
0 评论
2025-03-22

CAMx平流模块GPU CUDA移植优化

CAMx平流模块GPU CUDA移植优化
本文是对Cao et al.(2023)论文的进一步解读。GPU移植方案移植路线:Fortran代码先改成C代码,然后进一步使用CUDA C扩展改写。Fortran到C转换Fortran到C手动重写(可以借助一些转换工具)需要注意以下几点:实际上就是C/Fortran的符号链接、传参方式、数据类型对应、等价库函数以及存储方式。标准C到CUDA C转换由于Fortran不能直接调用CUDA C kernels,需要一个C接口程序用于传递参数和数据。优化手段减少CPU-GPU通信频率原来PPM平流方案Fortran实现方式不适合GPU计算。如下图所示,PPM水平平流以一维方式实现,先做x方向,再做y方向。比如x方向,核心程序hadvppm是针对x方向的一行数据进行计算,在四重嵌套循环(垂直层/平流时间子步/y方向/平流物种)内调用该程序。如果简单改写为C和CUDA C,每次只传输一行数据到GPU计算,CPU-GPU通信频繁且传输数据量小。因此,重构PPM实现,将hadvppm改写为对3D场一次性做x方向的PPM计算,这就要求将传递数据保存到三维或四维数组中,一次性传给GPU。GPU线...
2025年03月22日
14 阅读
0 评论
2025-03-22

CAMx平流模块GPU HIP移植优化

CAMx平流模块GPU HIP移植优化
Cao et al.(2024)发表了空气质量模型CAMx模式PPM(Piecewise Parabolic Method)平流模块在国产GPU加速器上使用HIP编程接口移植优化工作,是Cao et al.(2023) CUDA C优化工作的后续。硬件和编程模型文中所述的国产GPU加速器估计是曙光的DCU加速器。试验平台包括NVIDIA GPU和国产GPU,软硬件配置见下图国产GPU的显存是16GB的HBM2。Songshan超算和Taiyuan超算的国产GPU通过PCIe与CPU连接,主存和显存之间的数据传输峰值带宽分别为16GB/s和32GB/s。ROCm-HIP是AMD为其GPU设备开发的编程接口,对标NVIDIA的CUDA。两者使用非常类似,大多数情况下cuda c API接口cuda前缀替换为hip即可适用于AMD GPU。因此,有一个perl脚本工具HIPIFY可以将cuda c程序转换成hip程序。国产GPU只能使用HIP,不能使用CUDA。异构实现路线CAMx模式由Fortran语言编写,支持MPI+OpenMP。为了能够在GPU平台运行,需要先将其改写为C代码,...
2025年03月22日
13 阅读
0 评论

互动读者

标签云

最新回复

  1. tqymnonccc打酱油
    2024-09-27
  2. toibdpojay打酱油
    2024-09-22
  3. yvctxyevvw打酱油
    2024-09-22
  4. frezhwzwuq打酱油
    2024-09-22
登录
X
用户名
密码