生信小白杨阿云 2021-08-09 15:02 采纳率: 57.1%
浏览 302
已结题

使用tensorflow-gpu无法训练模型?

我使用conda下载了tensorflow-gpu==2.4.1,在照着tensorflow官网训练MINST数据集的时候发现训练结果非常差,验证集准确度只有0.09左右。中间还会出现很多行warning,这是怎么回事呢?用cpu训练,和用docker镜像的tensorflow-gpu训练都是没有问题的。

我的设备信息:

Ubuntu 20.04.2 LTS (GNU/Linux 5.8.0-59-generic x86_64)
anaconda3、python3.9.6

安装tensorflow-gpu==2.4.1的命令:

conda install -c anaconda tensorflow-gpu 

$ conda list结果
img
img

MINIST数据集训练参考代码:

https://keras.io/examples/vision/mnist_convnet/ https://keras.io/examples/vision/mnist_convnet/
训练过程warning和结果:在warning前一步Successfully opened dynamic library libcudart.so.10.1后会卡顿很久
img
img

  • 写回答

2条回答 默认 最新

  • Nefelibat 2021-08-11 21:30
    关注

    看你的运行结果是你的cuda版本过于低,gpu的性能没有完全利用,观察你的loss几乎没有变化,loss要下降趋势才是正常运行结果,调整一下超参数试试

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 9月14日
  • 已采纳回答 9月6日
  • 创建了问题 8月9日

悬赏问题

  • ¥15 调用函数时,无关变量的改变引起函数值的改变
  • ¥15 xy坐标转化为经纬度坐标
  • ¥15 一般三角模糊数的上界值和下届值取中值的多少比较合理?
  • ¥15 关于#python#的问题,请各位专家解答!
  • ¥20 Hbase启动失败,无法启动HMaster
  • ¥15 sqpingboot在父模块已经引入了mybatisplus 在子组件不写版本号还是报错
  • ¥20 Lumerical FDTD solutions 中模型的相对阻抗,有效介电常数和有效磁导率的实部和虚部的数据如何获得?
  • ¥100 sql reporting service 远程smtp服务器配置支持
  • ¥15 ppyoloe_r带角度目标检测,loss_cls没法收敛
  • ¥15 淘宝交易指数如何解读,其关联的数据指标是什么