ytxz1 2025-03-14 14:39 采纳率: 0%
浏览 56

nvqual使用报错

运行NVQUAL报错“write:fail”

问题遇到的现象和发生背景

刚刚开始从事GPU服务器测试相关工作,接触到NVQUAL测试软件,尝试在服务器中运行,却遇到一些问题,经过网络搜寻,难以找到类似的问题及解决方案,诚挚希望有佬可以刷到并提供一些建议。
报错:用root身份进入目录执行nvqual后,在Checking for File Permissions项会有“Write - Fail”这个报错,并且很快就会退出。

img

退出后目录下会自动生成一个文件nvqual.log。

img

操作环境、软件版本等信息

NVQUAL版本:HGX_H100_8-GPU_v05.2。

img

系统:Ubuntu22.04。

img

尝试过的解决方法

更改目录权限、切换普通用户身份通过sudo执行、更改运行参数(--list、--test2),结果依然如此。

img

试着打开执行文件查看其中的内容,发现都是加密过的。

img

进入mods目录下,运行check_config.sh,会有如下报错。

img

img

模块未加载,提示运行install_module.sh -i,然而目录内并没有该文件,不知如何继续进行了。

  • 写回答

3条回答 默认 最新

  • 阿里嘎多学长 2025-03-14 14:51
    关注

    阿里嘎多学长整理AIGC生成,因移动端显示问题导致当前答案未能完全显示,请使用PC端查看更加详细的解答过程

    NVQUAL 使用报错 "write:fail"

    你遇到的问题是 NVQUAL 测试软件在服务器中运行时报错 "write:fail",你已经尝试了网络搜索,但未能找到相似的解决方案。

    可能的解决方案:

    1. 检查文件权限:NVQUAL 需要写入一些文件,因此可能是文件权限问题导致的。请检查服务器上的文件权限是否正确。
    2. 检查磁盘空间:如果服务器的磁盘空间不足,NVQUAL 也可能会报错。请检查服务器的磁盘空间是否足够。
    3. 检查网络连接:NVQUAL 需要网络连接来写入结果文件。如果网络连接不稳定或断开,可能会导致报错。请检查网络连接是否稳定。
    4. 检查 NVQUAL 配置文件:NVQUAL 的配置文件可能存在错误或不正确的设置。请检查配置文件是否正确。

    如果以上解决方案都不能解决问题,请提供更多的错误信息和服务器配置信息,以便更好地帮助你解决问题。

    评论

报告相同问题?

问题事件

  • 创建了问题 3月14日