ONNXruntime添加自己EP的详细步骤

微软的ONNXruntime文档中有涉及EP的添加，但内容很简略，不知道有没有朋友自己亲自实现过添加自己或者别人的加速器硬件的抽象到ONNXruntime中

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

20条回答默认最新

专家-赤兔[在线] 全栈领域优质创作者 2024-03-21 23:27

关注

获得0.60元问题酬金

引自免费微信小程序：皆我百晓生

为了在ONNXRuntime中添加一个新的执行提供者（Execution Provider，EP），你需要实现一系列接口并将其与运行时集成。以下是一个超详细步骤的概述：

定义新EP类：首先，你需要创建一个继承自onnxruntime::Provider基类的新类，并实现必要的接口。例如：

namespace MyAccelerator {
  class MyExecutionProvider : public onnxruntime::IExecutionProvider {
  public:
    explicit MyExecutionProvider(const OrtProviderOptions& options) : IExecutionProvider(kMyExecutionProvider, options) {}

    // 实现必须的方法
    virtual Status Initialize() override;
    virtual void Shutdown() override;
    virtual std::unique_ptr<onnxruntime::IDataTransfer> GetDataTransfer() const override;
    virtual std::shared_ptr<IDataAllocator> CreateDataAllocator(int device_id, const OrtMemoryInfo& info) override;
    virtual common::Status GetCapability(const onnxruntime::GraphViewer& graph_viewer, ExecutionProvider::Capabilities& out) override;
    virtual std::vector<std::unique_ptr<ComputeCapability>> GetCapability(
      const onnxruntime::GraphViewer& graph,
      const std::vector<const KernelRegistry*>& kernel_registries) override;

    // 添加对模型节点进行优化和执行的方法
    virtual Status Compile(const std::vector<Node*>& fused_nodes, std::vector<NodeComputeInfo>& node_compute_info) override;
    virtual Status Execute(const std::vector<OrtValue>& inputs, std::vector<OrtValue>& outputs,
                          const std::vector<NodeComputeInfo>& node_compute_info,
                          const std::string& provider_name) override;
  };
}

实现核心功能：
- Initialize()：初始化硬件或软件环境。
- GetDataTransfer()：如果需要数据传输层，则实现此方法以处理跨设备的数据移动。
- CreateDataAllocator()：为该EP创建内存分配器。
- GetCapability()：分析模型图，确定EP可以支持哪些运算符。
- Compile() 和 Execute()：分别负责编译和执行由ONNX Runtime调度的计算图部分。

注册EP到ONNXRuntime：在ONNXRuntime启动前，通过调用RegisterExecutionProvider()函数将你的EP注册到全局上下文中：

using namespace onnxruntime;
using namespace MyAccelerator;

int main() {
  OrtEnv env(ORT_LOGGING_LEVEL_WARNING, "my_ort_session");
  OrtSessionOptions session_options;
  auto status = OrtSessionOptionsAppendExecutionProvider_MyExecutionProvider(session_options, /* your options */);
  if (!status.IsOK()) {
    // handle error
  }

  // 创建会话时使用session_options
  Ort::Session session(env, model_path.c_str(), session_options);

  // ...其余代码...
}

// 注册EP到ONNXRuntime的核心库
extern "C" ONNX_EXPORT void RegisterCustomExecutionProvider() {
  auto creator = [](const OrtProviderOptions& options) {
    return std::make_unique<MyExecutionProvider>(options);
  };
  onnxruntime::RegisterExecutionProviderFactory(MyExecutionProvider::Type(), creator);
}

构建和链接：将包含新EP实现的源文件添加到ONNXRuntime项目的构建系统中，并确保正确链接所需的库或框架。
测试：使用一些简单的ONNX模型来测试新EP是否能成功编译并执行模型中的操作。

注意：上述代码示例是简化的，实际开发中需要根据具体硬件加速器特性进行适配。此外，ONNXRuntime的API可能会随着版本更新而变化，请参考最新版的官方文档和源码进行开发。

编辑记录

报告相同问题？

关注问题

用Python编程EP检验 python
2022-11-17 18:52

回答 1 已采纳计算部分应该如下： import math l = [141, 148, 132, 138, 154, 142, 150, 146, 155, 158, 150, 140, 147, 1
请问这种类型 b'\x0ep\x07\x00' 如何转换 opencv python 数据结构
2022-06-26 09:21

回答 1 已采纳 int.from_bytes(b'\x0ep\x07\x00', byteorder='big', signed=True 有帮助请采纳，还有不懂的可以继续追问~
为什么安装Anaconda后，打不开Spyder，一直闪退？ python
2022-04-16 11:01

回答 1 已采纳 https://blog.csdn.net/m0_49197030/article/details/123382751https://blog.csdn.net/qq_43102225/article
onnx runtime文档学习4-Execution Providers (EP)架构
2024-03-12 09:23

whyte王的博客本教程第一篇：介绍ONNX Runtime(ORT)的基本概念。本教程第二篇：是一个快速指南，包括安装ONNX Runtime；安装ONNX进行模型输出；Pytorch, TensorFlow和SciKit的快速开始例子本教程第三篇：CUDA Execution Provider...
for循环误差问题，用下列公式求cos(x)的近似值，精确到最后一项的绝对值小于e: cos(x)=x0/0!−x2/2! c语言
2022-10-09 22:31

回答 1 已采纳 middle是个int，你乘那么多项，早溢出了
Android报错 IOException: Failed to load asset path /data/app/~~Iooecm android android-studio java
2023-01-30 20:49

回答 2 已采纳在listview上下个断点试试，这个貌似不是程序的问题，用真机调试试试，也有可能是log抽风了读取了应用之外的日志。
Pandas读取csv数据，写入excel进行库存管理 python
2022-08-13 17:17

回答 2 已采纳 for index, row in data_dao[0].iterrows(): 刀具型号 = index 出库数量 = row['数量'] try: 盘点数
onnxruntime配置OpenVINO-EP后端推理环境
2024-01-09 11:18

wangx569的博客当然也提供了dockerfile，在~/onnxruntime-1.16.2/dockerfiles中包含Dockerfile.openvino-centos7文件，可以按照。安装完成后，环境中的openvino版本可能过低导致onnxruntime编译报错，可以手动升级一下Openvino版本...
sql优化问题，如何创建索引 sql
2021-07-20 18:10

回答 1 已采纳这个查询语句要优化一下，尽量不要使用 in 用连接查询 save_time 条件放最前面
用tp6写的sql语句好像出bug了 php sql
2021-07-31 09:37

回答 2 已采纳因为join on是用来做关联的，按理说左右都应该是表名.字段名，tp会帮你加上反引号来避免关键字或保留字出现的错误，你那个条件应该写在where里而不是on里
关于modelsim仿真出现NO DATA的问题，如何解决？ fpga开发开发语言测试工具
2022-07-06 15:03

回答 1 已采纳已解决，tb文件中“always add_in = 3'b010;”写错了，不能这么写！
Ubuntu20.04安装CUDA、cuDNN、onnxruntime、TensorRT
2022-10-14 18:12

绿竹巷人的博客 Ubuntu20.04系统安装CUDA、cuDNN、onnxruntime、TensorRT
本题要求实现一个函数，用下列公式求cos(x)的近似值，精确到最后一项的绝对值小于e： cos(x)=x 0 /0!−x 2 /2!+x 4 /4!−x 6 /6!+⋯ c语言
2022-10-08 15:23

回答 1 已采纳可以看下c语言参考手册中的计算余弦（ \({\small\cos{x} }\)cos(x) ）-cos, cosf, cosl
onnx runtime文档学习3-CUDA provider
2024-03-11 14:59

whyte王的博客本教程第一篇：介绍ONNX Runtime(ORT)的基本概念。本教程第二篇：是一个快速指南，包括安装ONNX Runtime；安装ONNX进行模型输出；Pytorch, TensorFlow和SciKit的快速开始例子本教程第三篇(本博客)：CUDA Provider。
ONNXRuntime (Python) GPU 部署配置记录
2022-03-01 19:30

there2belief的博客最近偶尔捣鼓了一下onnxruntime-gpu(python版本)的服务端部署，于是打算简单记录一下一些关键步骤，免得以后忘了。确实，有些时候我们并不全是需要把模型转成MNN/ncnn/TNN后走移动端部署那套，服务端的部署也是个很...
onnxruntime C++ 使用（一）
2022-03-04 11:05

SongpingWang的博客文章目录一、简介什么是 ORT 模型格式？将 ONNX 模型转换为 ORT 格式脚本的输出脚本位置二、安装 ONNX runtime将 ONNX 模型转换为 ORT 格式脚本使用可选...官方网站：https://onnxruntime.ai/ 什么是 ORT 模型格式？
如何加载模型YOLOv8 ONNXRuntime
2023-08-05 12:30

TD程序员的博客详细介绍如何加载模型YOLOv8 ONNXRuntime
使用 ONNX RT 和裸机人工智能硬件加速引入 Windows 应用
2023-12-05 18:15

csdnsqst0046的博客虽然这样的智能感觉像是在施展魔法，但它们的能力并非源自魔法，而是建立在过去几年得到快速发展的强大。平台，基于移动计算领域多年的发展而构建。上构建应用并将其移植成原生应用的资料和文档。针对所有执行提供...
pytorch深度学习入门（15）之-使用onnx模型量化
2023-11-17 17:45

码农呆呆的博客例子动态量化： import onnx from onnxruntime.quantization import quantize_dynamic, QuantType model_fp32 = 'path/to/the/model.onnx' model_quant = 'path/to/the/model.quant.onnx' quantized_model = ...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 3月29日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月21日

悬赏问题

¥15 关于某款2.13寸墨水屏的问题
¥15 obsidian的中文层级自动编号
¥15 同一个网口一个电脑连接有网，另一个电脑连接没网
¥15 神经网络模型一直不能上GPU
¥15 pyqt怎么把滑块和输入框相互绑定，求解决！
¥20 wpf datagrid单元闪烁效果失灵
¥15 券商软件上市公司信息获取问题
¥100 ensp启动设备蓝屏，代码clock_watchdog_timeout
¥15 Android studio AVD启动不了
¥15 陆空双模式无人机怎么做

ONNXruntime添加自己EP的详细步骤

20条回答 默认 最新

问题事件

悬赏问题

20条回答默认最新