onnx转engine报错

TensorRT onnx转engine报错：

[TRT] [E] 2: [ltWrapper.cpp::nvinfer1::rt::CublasLtWrapper::setupHeuristic::334] Error Code 2: Internal Error
(Assertion cublasStatus == CUBLAS_STATUS_SUCCESS failed. )

环境说明：

tensorrt:8.X
pytorch1.7
cuda:10.2
cudnn:8.2.1
win10
Nvidia 1650 4G
python 3.7

我用yolov5转onnx再转engine没有问题。然后Resnet onnx转engine出现了错误，根据报错说是CUDA10.2需要打两个补丁，这两个补丁我也打了还是未解决。

通过Debug进行分析，可以通过onnx解析器构建network。并且可以获得正常的输入和输出结点名字以及shape，这个报错是发生在写入resnet.engine文件的时候出错的。

还有一点，如果我直接用tensorrt下bin目录下的trtexec.exe 将onnx转engine是可以成功的。所以不知道问题到底出现在了哪里。

下面是我的onnx转engine代码。
分析的的时候时发现**engineString = builder.build_engine(network, config)**返回为None，所以无法写入，但我network是已经成功构建好的呀，所以很奇怪。

def export_engine(model, im, file, half, workspace=4, verbose=False):
    # 首先判断一下im是不是在GPU上
    assert im.device.type != 'cpu', 'export running on CPU but must be on GPU, i.e.'
    import tensorrt as trt

    # 判断trt版本
    if trt.__version__[0] == '8':
        check_version(trt.__version__, '8.0.0', hard=True)  # require tensorrt>=8.0.0
        # 先转onnx
    onnx = file.with_suffix('.onnx')  # 获取权重名
    LOGGER.info(f'\n{prefix} starting export with TensorRT {trt.__version__}...')
    assert onnx.exists(), f'failed to export ONNX file: {onnx}'
    f = file.with_suffix('.engine')  # TensorRT engine file
    # 记录trt转engine日志
    logger = trt.Logger(trt.Logger.INFO)
    if verbose:
        logger.min_severity = trt.Logger.Severity.VERBOSE
    # 1.builder构造，记录日志
    builder = trt.Builder(logger)
    # 2.builder.config建立
    config = builder.create_builder_config()
    # 3.workspace 构建期间可用显存  workspace * 1 << 30 表示将workspace * 1 二进制左移30位后的10进制
    config.max_workspace_size = workspace * 1 << 30
    # 4.定义Network
    network = builder.create_network(1 << int(trt.NetworkDefinitionCreationFlag.EXPLICIT_BATCH))
    parser = trt.OnnxParser(network, logger) # 使用ONNX解析器导入model
    success = parser.parse_from_file(str(onnx))
    for idx in range(parser.num_errors):
        LOGGER.info(parser.num_errors(idx))
    if not success:
        raise RuntimeError(f'failed to load ONNX file: {onnx}')
    # 5.加载onnx解析器
    # if not parser.parse_from_file(str(onnx)):
    #     raise RuntimeError(f'failed to load ONNX file: {onnx}')
    # 6.获得网络输入输出
    inputs = [network.get_input(i) for i in range(network.num_inputs)]
    outputs = [network.get_output(i) for i in range(network.num_outputs)]

    # 下面的只是在log中打印input和output 的name和shape以及数据类型
    for inp in inputs:
        LOGGER.info(f'{prefix} input "{inp.name}" with shape{inp.shape} {inp.dtype}')
    for out in outputs:
        LOGGER.info(f'{prefix} output "{out.name}" with shape{out.shape} {out.dtype}')

    LOGGER.info(f'{prefix} building FP{16 if builder.platform_has_fast_fp16 and half else 32} engine as {f}')
    # 判断是否支持FP16推理
    if builder.platform_has_fast_fp16 and half:
        config.set_flag(trt.BuilderFlag.FP16)

    # build engine 文件的写入  这里的f是前面定义的engine文件
    engineString = builder.build_engine(network, config)
    if engineString == None:
        LOGGER.info("Failed getting serialized engine!")
        return
    LOGGER.info("Succeeded getting serialized engine!")
    with open(f, 'wb') as t:
        t.write(engineString)
        LOGGER.info("Succeeded saving .plan file!")

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
爱晚乏客游 2022-10-21 22:24
关注
Error when converting the ONNX model to TensorRT · Issue #866 · NVIDIA/TensorRT · GitHub Description Hi, I am trying to convert a Tensorflow model to TensorRT through onnx. Run command as bellow: trtexec --explicitBatch --workspace=2048 --onnx=trans11_dynamic.onnx --minShapes='input:0':1x1x128x1 --optShapes='input:0':1x16x12... https://github.com/NVIDIA/TensorRT/issues/866

你可以看下这个cuda10.2的小版本之间的区别，不行的话就升级到cuda11.x试试看吧。
这玩意邪乎的很，我yolov5用trt自带trtexec.exe就没成功过，都是得作者提供的代码转才行。如果你onnx使用自带的转换器可以成功的话，直接用自带就就好啊，还方便。
另外有些时候用c++代码可以转换成功，python下就失败，个人猜测可能是python下面某些库不兼容的问题。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Segment-Anything TensorRT部署------onnx转engine踩坑
2024-12-05 15:23

乘风破浪的coder的博客 SAM模型TensorRT部署及pytorch转onnx转engine文件踩坑
tensorRT踩坑日常之训练模型转ONNX转engine
2022-04-15 16:23

静待有缘人的博客 tensorRT踩坑日常之训练模型转ONNX转engine tensorRT是用来干嘛的在这里就不多介绍了在使用tensorRT提速之前需要先训练模型在将训练好的模型转ONNX再转engine 一、将训练好的模型转ONNX这里就提供将torch转ONNX，...
【YOLO 系列模型从 ONNX 到 TensorRT Engine 的转换指南：关键步骤与常见问题】
2025-03-20 07:40

Dymc的博客关键修改点包括：调整 ONNX 模型结构、处理动态输入、修复不支持的算子、集成后处理插件。根据具体错误信息调整转换参数或模型结构。文件导出为 TensorRT 的。使用 TensorRT 的。将 YOLO 系列模型的。
【onnx转tensorrt报错】IShuffleLayer applied to shape tensor must have 0 or 1 reshape dimensions: dimensi
2022-08-20 12:06

活成自己的样子啊的博客解决步骤： 1.pth --> onnx (mmclassification tools里面的pytorch2onnx.py) 2.onnx --> engine (mmdeploy 里面的 onnx2tensorrt.py) 注： 1.这里不使用mmdeploy直接转换的原因就是他可能会报这个错误！ 2.我使用...
onnx模型转TensorRT 报错 - Segmentation fault (core dumped) | Your ONNX model has been generated...【最新总结】
2021-09-26 18:35

墨理学AI的博客文章目录【运行报错一】Segmentation fault (core dumped)onnxsim 进行精简转换成功【PASSED 得到 yolov4_-1_3_608_608_dynamic.engine】【报错二】 ERROR: coreReadArchive.cpp (41) - Serializ.
tensorflow2.4导出模型转化为onnx模型后，通过tensorrt转化engine模型报错处理
2023-04-26 14:22

戈壁雄鹰1986的博客从.pb模型转onnx模型，再到engine模型转化，debug处理
深度学习的模型转换（.pt转换为.engine）
2024-04-26 11:25

书中藏着宇宙的博客 (2)如果是trtexec.exe转换的话，就需要先转为.onnx中间模型，在转换为.engine /usr/src/tensorrt/bin/trtexec --onnx=yolov8n.onnx --saveEngine=yolov8n.engine --fp16 或者(FP16类型） /usr/src/tensorrt/bin/...
YOLOv10支持哪些导出格式？ONNX和Engine区别解析
2026-01-21 03:03

高傲的大白杨的博客本文介绍了基于星图GPU平台如何自动化部署YOLOv10官版镜像...其中，TensorRT Engine格式可在NVIDIA GPU上实现低延迟、高吞吐的实时目标检测，广泛应用于智能交通、工业质检等AI推理任务，显著提升部署效率与性能表现。
onnx转tensorrt 实战干货总结
2022-06-21 01:09

AI算法网奇的博客 onnx转tensorrt学习笔记
【torch加速】python onnx to tensorRT报错NotImplementedError: Converting dtype(‘float16‘) to a ctypes type
2023-12-19 09:50

↣life♚的博客 onnx转tensorRT报错解决：NotImplementedError: Converting dtype('float16') to a ctypes type
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月15日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 8月7日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月21日

onnx转engine报错

TensorRT onnx转engine报错：

1条回答 默认 最新

问题事件

1条回答默认最新