ONNX最快的推理代码

请问一下最快的onnx是如何实现的。

我最近看见，有人的ONNX推理二十毫秒左右，还是没开gpu，而我使用python构建的opencv 显卡加速，才四五十毫秒。

这太强了，也不知道怎么做到的。我记得ONNX推理有两个库一个opencv 一个onnxruntime 可是这两个我都试了 onnxruntime略快，cpu可以达到四十左右，但还是没有二十毫秒左右速度。

不过我是用的python推理，c++不会调用。请问会的老哥c++ cpu推理onnx快多少，还是说有其他更高效的办法

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2023-09-13 12:28
关注
【以下回答由 GPT 生成】

首先，为了优化ONNX的推理性能，你可以考虑以下几个方面：

使用ONNX Runtime进行推理： ONNX Runtime是一个针对ONNX模型进行推理的高性能引擎，可以在CPU和GPU上同时进行推理。相比于OpenCV，ONNX Runtime具有更高的推理速度。你可以通过使用ONNX Runtime来加速你的推理过程。以下是一个使用ONNX Runtime进行推理的示例代码：

import onnxruntime as rt # 加载ONNX模型 sess = rt.InferenceSession('model.onnx') # 准备输入数据 input_data = np.random.randn(1, 3, 224, 224).astype(np.float32) # 进行推理 output = sess.run(None, {'input': input_data}) # 处理输出结果 # ...

使用GPU加速： 如果你有可用的GPU，可以考虑将推理过程迁移到GPU上，以获得更高的性能。ONNX Runtime支持在CUDA和OpenCL上进行GPU推理。以下是一个使用GPU进行推理的示例代码：

import onnxruntime as rt # 创建ONNX Runtime的配置 options = rt.SessionOptions() options.graph_optimization_level = rt.GraphOptimizationLevel.ORT_ENABLE_ALL options.execution_mode = rt.ExecutionMode.ORT_SEQUENTIAL # 指定使用GPU进行推理 options.disable_cpu_memory_arena = True options.enable_cuda = True # 加载ONNX模型 sess = rt.InferenceSession('model.onnx', options) # 准备输入数据 input_data = np.random.randn(1, 3, 224, 224).astype(np.float32) # 进行推理 output = sess.run(None, {'input': input_data}) # 处理输出结果 # ...

模型优化： 有时候，对模型进行一些优化可以提高推理性能。你可以尝试使用ONNX模型优化工具进行模型优化，以减少模型的计算量和推理时间。以下是一个使用ONNX模型优化工具的示例代码：

import onnx from onnxruntime.transformers import optimizer # 加载原始模型 model = onnx.load('model.onnx') # 进行模型优化 optimized_model = optimizer.optimize_model(model) # 保存优化后的模型 onnx.save(optimized_model, 'optimized_model.onnx')

以上是一些常用的优化方法，可以帮助你提高ONNX的推理性能。希望对你有帮助！如果以上方法还不能满足你的需求，你可以考虑使用其他高性能的推理引擎，如TensorRT或NVIDIA Triton Inference Server，它们提供了更高级别的优化和加速功能。

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

推理-找出罪犯，求代码 python 其他有问必答问答团队
2021-06-22 15:05

回答 1 已采纳 lst = ['a', 'b', 'c', 'd'] for criminal in lst: if [criminal in ['b','c','d'], criminal == 'c',
笔试推理编程题：两个乒乓球队进行比赛，各出三人。 java 开发语言
2021-08-17 20:47

回答 1 已采纳 1： public class Test { public static void main(String[] args) { // a的对手 for (ch
Prolog语言是否具有深度的价值? 开发语言有问必答
2021-05-16 23:36

回答 2 已采纳日本的第五代计算机的编程语言曾经选择Prolog语言，在当时就是代表未来科技的编程语言。Prolog 就是实现感知机器的希望。但多年的实践证明，Prolog 存在极高的不确定性，而且经常被 NP 问题
YOLOv5x6模型来了! 同样支持CPU上ONNX部署与推理
2021-06-29 07:00

3Ｄ视觉工坊的博客 80 = next(head_it) # 80out_blob_40 = next(head_it) # 40out_blob_20 = next(head_it) # 20 处理输入图象与推理 rgb = cv.cvtColor(frame, cv.COLOR_BGR2RGB)rgb = cv.resize(rgb, (w, h))image = np.float32(rgb....
HermiT推理结果知识图谱
2023-02-12 21:58

回答 3 已采纳你说的是哪个对话框，如果是解释推理结果的对话框是要你点击推理结果旁的问号才会弹出。参考 https://lookme.blog.csdn.net/article/details/88052390若有帮
（离散编程）试着利用命题公式的推理关系解决下列逻辑问题 c语言
2022-10-21 17:03

回答 2 已采纳这个里面有：https://wenku.baidu.com/view/d8a95c287fd184254b35eefdc8d376eeaeaa17b5.html
数字推理222222222222222222222222222 c++
2021-10-24 09:21

回答 1 已采纳 (f(n-2)+f(n-1))*2+1
Yolov3 CPU推理性能比较-Onnx、OpenCV、Darknet
2021-02-08 23:06

woshicver的博客为实时目标检测应用程序选择正确的推理框架变得非常具有挑战性，尤其是当模型应该在低功耗设备上运行时。在本文中，你将了解如何根据你的需要选择最佳的推理检测器，并发现它可以给你带来巨大的性能提升...
逻辑题：推理--黑桃：A Q 4 红心：J 8 4 2 7 3 梅花：K Q 5 4 6 方块：A 5 java 开发语言
2021-08-16 20:18

回答 4 已采纳单从甲的一句话分析，点数是重复的所以剩下黑桃：A Q 4红心：4梅花：Q 5 4方块：A 5单从乙的第一句话分析，说明他知道的花色，对应的那一行都有每个点数都有两份。所以剩下黑桃：A Q 4红心：梅花
离散数学的一阶逻辑的推理理论其他
2023-04-03 09:15

回答 1 已采纳根据化简律的结尾与附加率的开头一致，就可以发现其实它第二个实例其实是成立的，也就是两个都可以
c语言入门逻辑推理问题救 c语言
2022-10-26 16:52

回答 1 已采纳 b=0||1是个什么操作，你先理解了语法再来写代码，不要胡搞乱搞，不要全凭想象0||1是0或者1，它的返回值恒等于1，你这里相当于写b=1题目给你什么条件你就用什么条件，不要脑补不存在的条件来写乱七八
RK3588使用npu运行onnx模型推理
2023-10-26 15:00

韭菜钟的博客先说总体流程，我的RK3588板子上安装了Ubuntu22.04，可以直接在上面编程1.在x86主机上安装2.使用【rknn-toolkit2】，把onnx模型转换成rknn格式的模型。3.在板子部署【rknpu2】，在程序中调用接口编程即可。
执行yolov6推理命令后报错问题深度学习目标检测计算机视觉
2022-10-05 17:48

回答 1 已采纳权重文件有问题参考下边链接帖子里的办法AttributeError: 'Detect' object has no attribute 'grid_cell_size' · Issue #530 ·
NCNN、OpenVino、 TensorRT、MediaPipe、ONNX，各种推理部署架构，到底哪家强？
2021-11-14 21:26

深度人工智能的博客以深度学习为主的人工智能算法模型在日常AI应用中逐渐占据主流方向，相关的各类产品也是层出不穷。我们平时所看到的AI产品，像...目前市场上应用最广泛的部署工具主要有以下几种：腾讯公司开发的移动端平台部署工具
【模型推理加速系列】04：BERT加速方案对比 TorchScript vs. ONNX
2022-11-05 23:36

JasonLiu1919的博客本文以 BERT-base 的为例，介绍2种常用的推理加速方案：ONNX 和 TorchScript，并实测对比这两种加速方案与原始Pytorch模型格式的inference性能
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月13日

悬赏问题

¥15 关于#微信#的问题：微信实名不绑卡可以实现吗有没有专家可以解决
¥15 (标签-考研|关键词-set)
¥15 求修改代码，图书管理系统
¥15 请问有没求偏多标签数据集yeast,reference,recreation,scene,health数据集。
¥15 传感网应用开发单片机实训
¥15 Delphi 关于sAlphaImageList使用问题
¥15 寻找将CAJ格式文档转txt文本的方案
¥15 shein测试开发会问些啥我是写java的
¥15 关于#单片机#的问题：我有个课程项目设计，我想在STM32F103veTX单片机，M3主控模块上设计一个程序，在Keil uVision5（C语言）上代码该怎么编译？（嫌钱少我可以加钱，急急急）
¥15 opnet仿真网络协议遇到问题

ONNX最快的推理代码

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新