weixin_44206194 2019-03-16 13:19 采纳率: 0%
浏览 8371

用tensorflow-gpu跑SSD-Mobilenet模型GPU使用率很低这是为什么

这是GPU运行情况
这是GPU运行情况
这是训练过程
这是训练过程

  • 写回答

5条回答 默认 最新

  • threenewbee 2019-03-16 15:54
    关注

    batch size太小,导致模型的并行化程度太低。还有你的cpu、内存/显存带宽性能不足。

    评论
  • ecm16 2020-04-18 07:19
    关注

    试试legacy/train.py而非model main.py

    评论
  • 宗而研之 人工智能领域优质创作者 2020-12-09 11:55
    关注

    GPU利用率低可能有多方面的原因,首先要知道在训练过程中,不是所有的操作都是在GPU中进行,有一些前处理、后处理、日志记录等是在CPU上进行的,这就导致GPU并不是一直处于工作状态,可以通过运行 watch -n 1 nvidia-smi 来观察 GPU 的周期变化,可以看到是时高时低的,解决方法可以参考这篇博客https://blog.csdn.net/m0_38064529/article/details/103168172

    评论
  • 小宋是呢 人工智能领域优质创作者 2020-12-28 08:10
    关注

    出现类似原因一般都会数据处理读取成为模型训练的瓶颈。通俗的理解就是训练中对数据处理耗时较多,使得gpu无法大规模并行运算。解决可以从以下几个方面着手:

    • 将从硬盘数据读取到内存中,减少读取耗时
    • 开启多线程加速数据处理
    • 减少batch-size,缩短每次训练的数据处理时间
    评论
  • TensorFlow 社区 企业官方账号 2021-01-12 06:56
    关注

    感谢 @ZONG_XP 和@小宋是呢 的认真回答,楼主是否尝试过此方法呢?欢迎回来反馈结果~

    评论
编辑
预览

报告相同问题?

手机看
程序员都在用的中文IT技术交流社区

程序员都在用的中文IT技术交流社区

专业的中文 IT 技术社区,与千万技术人共成长

专业的中文 IT 技术社区,与千万技术人共成长

关注【CSDN】视频号,行业资讯、技术分享精彩不断,直播好礼送不停!

关注【CSDN】视频号,行业资讯、技术分享精彩不断,直播好礼送不停!

客服 返回
顶部