HPL Nvidia 在 UESTC 超算上单节点部署记录
HPL 又叫 High Performance Linpack,是超级计算机的基准之一,作为现代超算的标配。显然我们的 GPU 也要参与到 HPL 的实际测量里来。
https://developer.nvidia.com/nvidia-hpc-benchmarks-downloads
Nvidia 官方的很多库是一个大包整体供下载,一般直接搜索 Downloads 就好了。
超算 GPU 节点的环境如下

于是我们下载对应的包,这里又是一个坑,默认是用包管理器进行安装的,然而我们在超算集群上往往没有 sudo 权限。

在 Resources 这里有对应的 Zip 文件供下载。

然后接下来阅读 doc 我们大致了解一下项目结构

可以看到, Nvidia 除了自己的 GPU 版本以外还有 CPU 版本,不过我猜是针对 Vera 或者 DGX 上自研的 arm CPU 的。
默认情况下会直接链接 libmpi.so 。
不过注意,这里因为要用到 NVSHMEM 所以需要开启 nvidia-peermem 检查一下关键路径

配置好环境会要求我们提供这些参数,我们

直接修改 sample 里的 dat 文件即可。