用tensorrt的python api序列化生成的engine可以用于c++部署吗

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

CSDN-Ada助手 CSDN-AI 官方账号 2023-04-30 04:08

关注

以下回答由chatgpt基于相关博客总结生成:

可以将通过使用TensorRT Python API序列化生成的Engine文件用于C++部署。需要注意以下问题： 1.在C++中需要使用C++ API来进行反序列化和执行推理，具体可以参考TensorRT C++ API的文档。 2.需要注意在C++中使用的数据类型和数据格式，需要与Python中保持一致。 3.在C++中需要手动分配内存并绑定输入输出，具体方式可以参考以下示例代码：

//创建logger：日志记录器
auto logger = make_shared<nvinfer1::ILogger>();

//读取Engine文件并反序列化
ifstream engine_file("sample.engine", ios::binary);
if (!engine_file.good())
{
    throw runtime_error("文件读取失败");
}
ostringstream buffer;
buffer << engine_file.rdbuf();
string serialized_engine = buffer.str();
unique_ptr<nvinfer1::IRuntime> runtime{ nvinfer1::createInferRuntime(*logger) };
unique_ptr<nvinfer1::ICudaEngine> engine{ runtime->deserializeCudaEngine(serialized_engine.data(), serialized_engine.size(), nullptr) };

// 分配主机和设备buffers
vector<void*> host_buffers(engine->getNbBindings());
vector<void*> device_buffers(engine->getNbBindings());
vector<int64_t> binding_sizes(engine->getNbBindings());
for (int32_t i = 0; i < engine->getNbBindings(); i++)
{
    auto dims = engine->getBindingDimensions(i);
    int32_t volume = accumulate(begin(dims), end(dims), 1, multiplies<int32_t>());
    binding_sizes[i] = volume * sizeof(float);
    cudaMalloc(&device_buffers[i], binding_sizes[i]);
    host_buffers[i] = malloc(binding_sizes[i]);
    if (engine->bindingIsInput(i))
    {
        //如果是输入参数,则将数据从主机内存拷贝到设备内存
        cudaMemcpy(device_buffers[i], input_data, binding_sizes[i], cudaMemcpyHostToDevice);
    }
}

//异步执行推理
unique_ptr<nvinfer1::IExecutionContext> context{ engine->createExecutionContext() };
context->enqueueV2(device_buffers.data(), cudaStream_t{ 0 }, nullptr);
for (int32_t i = 0; i < engine->getNbBindings(); i++)
{
    if (!engine->bindingIsInput(i))
    {
        //如果是输出参数,则将数据从设备内存拷贝到主机内存
        cudaMemcpy(host_buffers[i], device_buffers[i], binding_sizes[i], cudaMemcpyDeviceToHost);
    }
}

报告相同问题？

关注问题

请问python代码生成的.so库，是否可以在C++文件中调用 c++ python
2020-07-15 20:48

回答 1 已采纳 https://blog.csdn.net/u013378306/article/details/70172394
用python和c++编程 c++ python 有问必答
2021-12-11 14:36

回答 1 已采纳 class house(): def __init__(self, code, layer, long, width): self.code = code se
如何用编程语言求输出数字序列？(语言-python) python
2023-03-18 16:26

回答 4 已采纳该回答引用GPTᴼᴾᴱᴺᴬᴵ可以使用Python中的for循环和range函数来实现输出小于n的所有自然数，每个数字之间用空格分隔的效果。下面是一个简单的示例代码： n = int(input("请
详解TensorRT的C++高性能部署以及C++部署Yolo实践
2024-09-06 21:35

Andrew_Xzw的博客详解TensorRT的C++高性能部署以及C++部署Yolo实践
python 用fastApi制作的接口，怎么部署到云服务器上？ python
2022-07-21 17:30

回答 2 已采纳你在服务器上运行你开接口的代码，然后去设置云服务器的安全组，打开你的接口端口
用c++调用python脚本，python脚本生成的界面能集成到c++的界面上吗？ mfc python
2021-08-10 16:46

回答 1 已采纳您可以尝试调用系统函数，把matlibplot的窗口作为C++窗口的子窗口，然后再后续操作。
c++如何封装Python写的pytorch模型生成exe文件 c++ python 机器学习
2022-01-27 19:52

回答 1 已采纳将你的模型转成ONNX然后openvino就能读取了。如果遇到一些网络层不能转到onnx，那就比较麻烦，需要替换成你自己实现的网络层才能导出onnx
使用C++部署TensorRT
2021-11-10 19:01

wq_0708的博客使用C++ API构建TensorRT engine
Dem和dom如何生成流畅的osgb(语言-c++) c++ python
2023-02-25 20:48

回答 4 已采纳参考GPT和自己的思路，在处理大数据量的OSGB文件时，可以尝试以下几个方法来提高浏览流畅性：使用LOD（Level of Detail）技术使用LOD技术可以在保持地形数据的精度的同时，减少需要渲
C++真的不如Python吗？有问必答职场和发展
2021-08-03 20:13

回答 3 已采纳看你学习一门语言的目的了。如果是为了学习编程的基础知识，越高级的语言抽象程度越高，帮你做的事更多，反而不利于进一步学习。C++这种比python低级一些（这里的高级低级不是褒贬，而是是否更贴近底层实现
python可以像c加加一样用scanf输入吗？ c++ python 有问必答
2021-11-26 08:49

回答 2 已采纳 python没有scanf函数，使用input函数输入数据，input函数读取的数据是string类型，需要根据实际需要进行转换stra = input("please input a number:
Python API构建TensorRT加速模型的步骤详解
2024-07-04 18:07

ytusdc的博客先来一段摘抄自网上的TensorRT介绍：TensorRT是英伟达针对自家平台做的加速包，TensorRT主要做了...TensorRT用来做模型的推理优化，也是有Python接口的，实际使用测试下来，python接口的模型推理速度C++基本差不多的。
Python中pandas读取数据库engine=create_engine()可以多人使用一个连接吗? django python
2019-08-23 14:55

回答 2 已采纳可以共用的，不会冲突
YOLOv5 Tensorrt Python/C++部署
2022-04-10 13:18

一笑奈何LHY的博客 YOLOv5 Tensorrt Python/C++部署支持Windows10/Linux
TensorRT的使用流程c++和python
2024-08-14 23:51

yzZ_here的博客 tensorrt的粗知识
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月30日

悬赏问题

¥50 安装华大九天aether
¥30 关于#算法#的问题：运用EViews第九版本进行一系列计量经济学的时间数列数据回归分析预测问题求各位帮我解答一下
¥15 setInterval 页面闪烁，怎么解决
¥15 如何让企业微信机器人实现消息汇总整合
¥50 关于#ui#的问题：做yolov8的ui界面出现的问题
¥15 如何用Python爬取各高校教师公开的教育和工作经历
¥15 TLE9879QXA40 电机驱动
¥20 对于工程问题的非线性数学模型进行线性化
¥15 Mirare PLUS 进行密钥认证？（详解）
¥15 物体双站RCS和其组成阵列后的双站RCS关系验证

用tensorrt的python api序列化生成的engine可以用于c++部署吗

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新