生信小白杨阿云 2021-08-09 15:02 采纳率: 57.1%
浏览 299
已结题

使用tensorflow-gpu无法训练模型?

我使用conda下载了tensorflow-gpu==2.4.1,在照着tensorflow官网训练MINST数据集的时候发现训练结果非常差,验证集准确度只有0.09左右。中间还会出现很多行warning,这是怎么回事呢?用cpu训练,和用docker镜像的tensorflow-gpu训练都是没有问题的。

我的设备信息:

Ubuntu 20.04.2 LTS (GNU/Linux 5.8.0-59-generic x86_64)
anaconda3、python3.9.6

安装tensorflow-gpu==2.4.1的命令:

conda install -c anaconda tensorflow-gpu 

$ conda list结果
img
img

MINIST数据集训练参考代码:

https://keras.io/examples/vision/mnist_convnet/ https://keras.io/examples/vision/mnist_convnet/
训练过程warning和结果:在warning前一步Successfully opened dynamic library libcudart.so.10.1后会卡顿很久
img
img

  • 写回答

2条回答 默认 最新

  • Nefelibat 2021-08-11 21:30
    关注

    看你的运行结果是你的cuda版本过于低,gpu的性能没有完全利用,观察你的loss几乎没有变化,loss要下降趋势才是正常运行结果,调整一下超参数试试

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 9月14日
  • 已采纳回答 9月6日
  • 创建了问题 8月9日

悬赏问题

  • ¥15 关于logstash转发日志时发生的部分内容丢失问题
  • ¥17 pro*C预编译“闪回查询”报错SCN不能识别
  • ¥15 微信会员卡接入微信支付商户号收款
  • ¥15 如何获取烟草零售终端数据
  • ¥15 数学建模招标中位数问题
  • ¥15 phython路径名过长报错 不知道什么问题
  • ¥15 深度学习中模型转换该怎么实现
  • ¥15 Stata外部命令安装问题求帮助!
  • ¥15 从键盘随机输入A-H中的一串字符串,用七段数码管方法进行绘制。提交代码及运行截图。
  • ¥15 如何用python向钉钉机器人发送可以放大的图片?