HPL Nvidia 在 UESTC 超算上单节点部署记录

HPL 又叫 High Performance Linpack，是超级计算机的基准之一，作为现代超算的标配。显然我们的 GPU 也要参与到 HPL 的实际测量里来。

Nvidia 官方的很多库是一个大包整体供下载，一般直接搜索 Downloads 就好了。

超算 GPU 节点的环境如下

于是我们下载对应的包，这里又是一个坑，默认是用包管理器进行安装的，然而我们在超算集群上往往没有 sudo 权限。

在 Resources 这里有对应的 Zip 文件供下载。

然后接下来阅读 doc 我们大致了解一下项目结构

可以看到， Nvidia 除了自己的 GPU 版本以外还有 CPU 版本，不过我猜是针对 Vera 或者 DGX 上自研的 arm CPU 的。

默认情况下会直接链接 libmpi.so 。

不过注意，这里因为要用到 NVSHMEM 所以需要开启 nvidia-peermem 检查一下关键路径

配置好环境会要求我们提供这些参数，我们

直接修改 sample 里的 dat 文件即可。