yolov5 detect.py推理.onnx速度很慢

请问我使用官方的export.py转换出来的onnx推理很慢是什么原因？安装环境时执行的是代码头部给出的命令，pip查看也安装的是onnxruntime-gpu。
转换时参数设置

def parse_opt():
    parser = argparse.ArgumentParser()
    parser.add_argument('--data', type=str, default=ROOT / 'data/nj.yaml', help='dataset.yaml path')
    parser.add_argument('--weights', nargs='+', type=str, default=ROOT / 'best.pt', help='model.pt path(s)')
    parser.add_argument('--imgsz', '--img', '--img-size', nargs='+', type=int, default=[640, 640], help='image (h, w)')
    parser.add_argument('--batch-size', type=int, default=4, help='batch size')
    parser.add_argument('--device', default='cpu', help='cuda device, i.e. 0 or 0,1,2,3 or cpu')
    parser.add_argument('--half', action='store_true', help='FP16 half-precision export')
    parser.add_argument('--inplace', action='store_true', help='set YOLOv5 Detect() inplace=True')
    parser.add_argument('--train', action='store_true', help='model.train() mode')
    parser.add_argument('--optimize', action='store_true', help='TorchScript: optimize for mobile')
    parser.add_argument('--int8', action='store_true', help='CoreML/TF INT8 quantization')
    parser.add_argument('--dynamic', action='store_true', help='ONNX/TF: dynamic axes')
    parser.add_argument('--simplify', action='store_true', help='ONNX: simplify model')
    parser.add_argument('--opset', type=int, default=12, help='ONNX: opset version')
    parser.add_argument('--verbose', action='store_true', help='TensorRT: verbose log')
    parser.add_argument('--workspace', type=int, default=4, help='TensorRT: workspace size (GB)')
    parser.add_argument('--nms', action='store_true', help='TF: add NMS to model')
    parser.add_argument('--agnostic-nms', action='store_true', help='TF: add agnostic NMS to model')
    parser.add_argument('--topk-per-class', type=int, default=100, help='TF.js NMS: topk per class to keep')
    parser.add_argument('--topk-all', type=int, default=100, help='TF.js NMS: topk for all classes to keep')
    parser.add_argument('--iou-thres', type=float, default=0.45, help='TF.js NMS: IoU threshold')
    parser.add_argument('--conf-thres', type=float, default=0.25, help='TF.js NMS: confidence threshold')
    parser.add_argument('--include', nargs='+',
                        default=['onnx'],
                        help='torchscript, onnx, openvino, engine, coreml, saved_model, pb, tflite, edgetpu, tfjs')
    opt = parser.parse_args()
    print_args(FILE.stem, opt)
    return opt

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
玥轩_521 2023-08-08 12:38
关注
援引GPT回答：
导致推理速度慢的原因可能有很多，以下是一些可能的原因：

模型结构复杂：如果模型的结构非常复杂，包含大量的层和参数，那么推理速度可能会较慢。可以尝试简化模型结构或者使用更轻量级的模型。

输入图像尺寸过大：如果输入的图像尺寸很大，会增加推理的计算量，导致推理速度较慢。可以尝试将图像尺寸调整为更小的尺寸。

批处理大小过小：如果批处理大小设置得太小，会导致GPU利用率较低，从而影响推理速度。可以尝试增大批处理大小。

使用的设备不支持GPU加速：如果使用的设备不支持GPU加速，即使安装了onnxruntime-gpu，推理仍然会在CPU上运行，导致速度慢。可以确认设备是否支持GPU加速。

模型转换参数设置不合理：在转换模型时，可能需要根据实际情况调整一些参数，例如是否使用半精度（FP16）、是否进行优化等。可以尝试调整这些参数，看看是否会影响推理速度。

以上是一些可能的原因，具体原因还需要根据实际情况进行排查。可以尝试调整一些参数，或者使用其他工具或框架进行推理，看看是否能够改善推理速度。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

yolov5用官方detect.py检测只有图片输出无txt输出 python 人工智能有问必答深度学习
2022-04-12 23:41

回答 2 已采纳加上这个参数
yolov5用官方权重文件测试detect.py检测无响应深度学习
2023-04-03 22:29

回答 5 已采纳原因很简单，就是你的cuda版本错误了。英伟达的显卡从30系开始，就不支持cuda11.0以下的cuda版本了，你这个40系的需要安装cuda11以上的cuda版本才行。所以解决方案就是换cpu，或者
yolov5用官方权重文件测试detect.py检测无结果深度学习
2021-02-01 19:23

回答 7 已采纳在detect函数下加上cudnn.benchmark = True就可以了
【Yolov5】1.认真总结6000字Yolov5保姆级教程（2022.06.28全新版本v6.1）
2021-08-03 00:26

若oo尘的博客爆肝6000字Yolov5保姆级教程，80岁老奶奶都看得懂。文章特点：一个完整的流程，从头教到尾，不讲冗长的理论，实操
YOLOv5运行detect.py时出现的 python 人工智能有问必答深度学习
2022-02-02 21:10

回答 2 已采纳要求:colorama;platform_system == "windows"未找到，并且是YOL0v5所需要的，试图自动更新大致意思就是说：没找到colorama，你需要安装它。colorama
运行YOLOv5包里的detect.py后发生错误 python 深度学习目标检测
2022-07-25 09:14

回答 2 已采纳你改成摄像头了，但是你的摄像头找不到就这样了呗。你看下17行的报错，cap就是摄像头，isopen为false报错，说明开启摄像头失败
yolov5运行报错detect.py: error: unrecognized arguments: class 0 python 目标检测
2022-04-29 14:57

回答 1 已采纳改成class_0试试有帮助望采纳，谢谢！
【详细记录】rv1126 跑通 yolov5
2023-08-02 11:01

爱钓鱼的歪猴的博客在前面，已经将 onnx模型转为 rknn模型。这里探讨的是：rknn模型在rv1126开发板上运行。
跑YOLOV5中detect.py遇到的问题 python
2022-09-04 10:48

回答 2 已采纳你检查一下 device所指向的设备到底是cpu还是gpu，可能是显卡cuda没装好，或者不支持的问题导致模型没办法加载在相应的设备上
下载最热门的YOLOV5代码直接运行detect.py文件，出现userwaning怎么解决 python pytorch 有问必答
2022-01-29 19:15

回答 4 已采纳这个应该是版本问题，你按照教程安装对应的模块版本试试
yolov5 分割训练detect.py有错误得不到结果 python 深度学习
2023-03-30 22:09

回答 1 已采纳分割运行segment/predict.py这个文件而不是detect.py
Yolov3 CPU推理性能比较-Onnx、OpenCV、Darknet
2021-02-08 23:06

woshicver的博客为实时目标检测应用程序选择正确的推理框架变得非常具有挑战性，尤其是当模型应该在低功耗设备上运行时。在本文中，你将了解如何根据你的需要选择最佳的推理检测器，并发现它可以给你带来巨大的性能提升...
运行yolov5的detect.py时出错【WWinError 32】，整个项目文件夹被删除试怎么回事 python 人工智能图像处理
2022-08-18 19:44

回答 2 已采纳你的output目录配置不对，然后他的detect.py默认先删除配置的output目录，结果你配置的是detect.py的父目录，就出现这个问题了，你修改下output路径就好了
windows使用YOLOv8训练自己的模型（0基础保姆级教学）
2023-04-02 14:36

Pan_peter的博客 1、启动train.py，进行训练 2、我们可以直接使用命令进行训练三、其他问题 1、训练时，为什么会生成labels.cache文件？ 2、YOLOv8的训练图像和相应的标注文件应该放同一个文件夹里吗？还是应该分开放？
嵌入式AI---yolov5模型转化为华为昇腾om模型
2024-07-29 10:38

李华_的博客本文介绍了如何将.pt模型文件转化为onnx格式，以及将onnx格式转换为om文件的两种方法
【深度学习】目标检测 yolov5模型量化安装教程以及转ONXX，torchscript，engine和速度比较一栏表
2022-09-15 04:12

weixin_40293999的博客 yolov5 的模型量化,好好看看export.py 写的很清楚了, step1:pip install -r requirements.txt coremltools onnx onnx-simplifier onnxruntime-gpu openvino-dev tensorflow # GPU step2: python export.py --weights...
YOLOv5参数大全(parse_opt篇)
2024-04-14 00:39

wisdom_zhe的博客 YOLOv5的opt参数解释
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月8日

悬赏问题

¥15 平板录音机录音问题解决
¥15 请问维特智能的安卓APP在手机上存储传感器数据后，如何找到它的存储路径?
¥15 (SQL语句|查询结果翻了4倍)
¥15 Odoo17操作下面代码的模块时出现没有'读取'来访问
¥50 .net core 并发调用接口问题
¥15 网上各种方法试过了，pip还是无法使用
¥15 用verilog实现tanh函数和softplus函数
¥15 Hadoop集群部署启动Hadoop时碰到问题
¥15 求京东批量付款能替代天诚
¥15 slaris 系统断电后，重新开机后一直自动重启

yolov5 detect.py推理.onnx速度很慢

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新