运行NVQUAL报错“write:fail”
问题遇到的现象和发生背景
刚刚开始从事GPU服务器测试相关工作,接触到NVQUAL测试软件,尝试在服务器中运行,却遇到一些问题,经过网络搜寻,难以找到类似的问题及解决方案,诚挚希望有佬可以刷到并提供一些建议。
报错:用root身份进入目录执行nvqual后,在Checking for File Permissions项会有“Write - Fail”这个报错,并且很快就会退出。

退出后目录下会自动生成一个文件nvqual.log。

操作环境、软件版本等信息
NVQUAL版本:HGX_H100_8-GPU_v05.2。

系统:Ubuntu22.04。

尝试过的解决方法
更改目录权限、切换普通用户身份通过sudo执行、更改运行参数(--list、--test2),结果依然如此。

试着打开执行文件查看其中的内容,发现都是加密过的。

进入mods目录下,运行check_config.sh,会有如下报错。


模块未加载,提示运行install_module.sh -i,然而目录内并没有该文件,不知如何继续进行了。