生信小白杨阿云 2021-08-09 15:02 采纳率: 57.1%
浏览 299
已结题

使用tensorflow-gpu无法训练模型?

我使用conda下载了tensorflow-gpu==2.4.1,在照着tensorflow官网训练MINST数据集的时候发现训练结果非常差,验证集准确度只有0.09左右。中间还会出现很多行warning,这是怎么回事呢?用cpu训练,和用docker镜像的tensorflow-gpu训练都是没有问题的。

我的设备信息:

Ubuntu 20.04.2 LTS (GNU/Linux 5.8.0-59-generic x86_64)
anaconda3、python3.9.6

安装tensorflow-gpu==2.4.1的命令:

conda install -c anaconda tensorflow-gpu 

$ conda list结果
img
img

MINIST数据集训练参考代码:

https://keras.io/examples/vision/mnist_convnet/ https://keras.io/examples/vision/mnist_convnet/
训练过程warning和结果:在warning前一步Successfully opened dynamic library libcudart.so.10.1后会卡顿很久
img
img

  • 写回答

2条回答 默认 最新

  • Nefelibat 2021-08-11 21:30
    关注

    看你的运行结果是你的cuda版本过于低,gpu的性能没有完全利用,观察你的loss几乎没有变化,loss要下降趋势才是正常运行结果,调整一下超参数试试

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 9月14日
  • 已采纳回答 9月6日
  • 创建了问题 8月9日

悬赏问题

  • ¥15 linux驱动,linux应用,多线程
  • ¥20 我要一个分身加定位两个功能的安卓app
  • ¥15 基于FOC驱动器,如何实现卡丁车下坡无阻力的遛坡的效果
  • ¥15 IAR程序莫名变量多重定义
  • ¥15 (标签-UDP|关键词-client)
  • ¥15 关于库卡officelite无法与虚拟机通讯的问题
  • ¥15 目标检测项目无法读取视频
  • ¥15 GEO datasets中基因芯片数据仅仅提供了normalized signal如何进行差异分析
  • ¥100 求采集电商背景音乐的方法
  • ¥15 数学建模竞赛求指导帮助