wxypku 2018-07-05 02:44 采纳率: 20%
浏览 10584
已结题

mpi在多节点上的运行问题

我安转的是openmpi,用mpirun在两个节点上运行的时候出现如下错误,求助是什么原因。
shell$: /usr/local/openmpi/bin/mpiexec -np 2 --hostfile nodeinfo ./test
错误提示:
Primary job terminated normally, but 1 process returned

a non-zero exit code.. Per user-direction, the job has been aborted.

./test: error while loading shared libraries: libcudart.so.9.0: cannot open shared object file: No such file or directory

./test: error while loading shared libraries: libcudart.so.9.0: cannot open shared object file: No such file or directory

mpiexec detected that one or more processes exited with non-zero status, thus causing
the job to be terminated. The first process to do so was:

Process name: [[65150,1],0]

Exit code: 127

  • 写回答

2条回答

  • 桃汽宝 2021-01-02 14:59
    关注

    请问您解决了吗 我也遇到了这个问题

    评论

报告相同问题?

悬赏问题

  • ¥15 素材场景中光线烘焙后灯光失效
  • ¥15 请教一下各位,为什么我这个没有实现模拟点击
  • ¥15 执行 virtuoso 命令后,界面没有,cadence 启动不起来
  • ¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
  • ¥20 有关区间dp的问题求解
  • ¥15 多电路系统共用电源的串扰问题
  • ¥15 slam rangenet++配置
  • ¥15 有没有研究水声通信方面的帮我改俩matlab代码
  • ¥15 ubuntu子系统密码忘记
  • ¥15 保护模式-系统加载-段寄存器