Blas SGEMM launch failed : m=12, n=170, k=324
[[Node: conv3d/Conv3D = Conv3D[T=DT_FLOAT, _class=["loc:@training/Adam/gradients/conv3d/Conv3D_grad/Conv3DBackpropInputV2"], data_format="NDHWC", dilations=[1, 1, 1, 1, 1], padding="SAME", strides=[1, 1, 1, 1, 1], _device="/job:localhost/replica:0/task:0/device:GPU:0"](lambda_5/ExpandDims_2, conv3d/Conv3D/ReadVariableOp)]]
[[Node: loss/mul/_2409 = _Recv]]
GPU没有分配给其他进程情况下出现问题,环境tf-GPU1.12
- 写回答
- 好问题 0 提建议
- 关注问题
- 邀请回答
-
2条回答 默认 最新
关注引自免费微信小程序-皆我百晓生,希望对题主有所帮助,如有帮助,还请采纳。
这个错误通常是由GPU显存不足或者其他进程占用了GPU资源导致的。可以尝试以下解决方案:
确保没有其他进程正在占用GPU资源。使用命令
nvidia-smi可以查看当前GPU的使用情况,确保没有其他进程在使用GPU。如果GPU显存不足,可以尝试减少模型的大小或者批量大小,或者使用更大的GPU。
检查是否安装了正确版本的CUDA和cuDNN。确保安装了与TensorFlow版本兼容的CUDA和cuDNN。
尝试升级TensorFlow版本到最新版本。有时候更新TensorFlow版本可以解决一些GPU相关的问题。
重新启动计算机,有时候重启可以解决临时的GPU问题。
如果以上解决方案无效,可能还需要更多的信息来进一步分析问题,例如完整的代码和相关的系统配置信息。
解决 无用评论 打赏 举报