如何将PyTorch模型从ckpt转换为ONNX格式？

**如何将PyTorch模型从ckpt文件转换为ONNX格式？** 在深度学习模型部署过程中，常需将训练好的PyTorch模型（通常保存为`.ckpt`或`.pt`格式）转换为ONNX格式以实现跨平台兼容性。然而，许多开发者在加载检查点文件、重建模型结构及执行导出时遇到困难。本文将详细介绍如何正确加载PyTorch模型、构造输入张量，并使用`torch.onnx.export`接口将其转换为ONNX格式，涵盖常见问题如模型结构不匹配、输入维度错误等，帮助你顺利完成模型转换与部署。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
ScandalRafflesia 2025-06-28 01:26
关注
一、PyTorch模型与ONNX格式简介

在深度学习模型部署过程中，常常需要将训练好的模型转换为通用的中间表示格式，以便于在不同平台和框架中进行推理。ONNX（Open Neural Network Exchange）是一种开放的神经网络交换格式，支持多种深度学习框架之间的模型互操作。

PyTorch通常使用`.pt`或`.ckpt`文件保存模型状态字典（state_dict），这些文件仅包含模型参数，并不包含完整的模型结构定义。因此，在将模型转换为ONNX格式之前，必须先重建模型结构并加载对应的参数。

ONNX的优势：跨平台兼容、支持多种推理引擎（如TensorRT、ONNX Runtime等）
PyTorch模型保存方式：state_dict / 整体模型保存

二、准备环境与依赖项

为了顺利完成从`.ckpt`到ONNX的转换，需确保以下软件包已安装：

库名版本要求
torch >=1.8.0
onnx >=1.9.0
onnxruntime >=1.8.0

可通过如下命令安装必要依赖：

pip install torch onnx onnxruntime

三、加载PyTorch模型检查点

PyTorch模型通常以两种方式保存：

仅保存模型参数（state_dict）
保存整个模型（model.save）

若使用的是state_dict方式保存的`.ckpt`文件，则需手动重新构建模型结构后再加载参数。

# 示例：加载state_dict import torch from model_definition import MyModel # 假设这是你的模型定义 model = MyModel() checkpoint = torch.load('model.ckpt') model.load_state_dict(checkpoint['model_state_dict']) model.eval() # 设置为评估模式

四、构造输入张量

导出ONNX模型时，必须提供一个或多个示例输入张量，用于追踪模型执行路径。

输入张量的维度应与训练/推理时一致。例如，图像分类任务中常见的输入形状为 (batch_size, channels, height, width)。

# 构造虚拟输入 dummy_input = torch.randn(1, 3, 224, 224) # batch_size=1, 3通道，224x224图像

注意：如果模型有多个输入，可以传入元组形式。

五、使用torch.onnx.export接口导出ONNX模型

PyTorch提供了`torch.onnx.export`函数用于导出模型至ONNX格式。

import torch.onnx # 导出ONNX模型 torch.onnx.export( model, dummy_input, "model.onnx", export_params=True, # 存储训练参数 opset_version=13, # ONNX算子集版本 do_constant_folding=True, # 优化常量 input_names=['input'], # 输入节点名称 output_names=['output'], # 输出节点名称 dynamic_axes={ 'input': {0: 'batch_size'}, # 动态维度 'output': {0: 'batch_size'} } )

该函数支持多种参数配置，可满足静态图和动态图的需求。

六、验证ONNX模型正确性

导出后，建议使用ONNX Runtime进行推理测试，以确保模型输出与原始PyTorch模型一致。

import onnx import onnxruntime as ort import numpy as np # 加载ONNX模型 onnx_model = onnx.load("model.onnx") onnx.checker.check_model(onnx_model) # 创建推理会话 ort_session = ort.InferenceSession("model.onnx") # 运行推理 outputs = ort_session.run( None, {'input': dummy_input.numpy()} ) print(outputs[0])

七、常见问题与解决方案

模型结构不匹配：确认模型定义与保存的state_dict完全一致。
输入维度错误：确保dummy_input与训练时输入一致，尤其注意通道顺序。
导出失败，提示未支持的操作：尝试更新PyTorch版本或使用更高级的opset版本。
动态轴未生效：检查dynamic_axes参数是否正确定义。

八、进阶技巧与优化建议

使用ONNX TensorRT加速推理
利用ONNX Runtime进行多平台部署
使用自定义ONNX符号化函数支持特定层
graph TD A[开始] --> B{是否有完整模型结构?} B -- 是 --> C[直接加载模型] B -- 否 --> D[手动定义模型结构] D --> E[加载state_dict] C --> E E --> F[构建输入张量] F --> G[调用torch.onnx.export] G --> H[生成ONNX模型] H --> I[使用ONNX Runtime验证]
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

库名	版本要求
torch	>=1.8.0
onnx	>=1.9.0
onnxruntime	>=1.8.0

报告相同问题？

关注问题

PyTorch常用模型格式及使用
2024-09-09 19:11

浩瀚之水_csdn的博客它本质上是一个Python字典对象，将模型中的每一层（特别是那些具有可学习参数的层，如卷积层、线性层等）映射到其对应的参数张量（即权重和偏差）。在深度学习框架（如PyTorch）中，状态字典（state_dict）主要包含...
ONNX入门指南（一）：跨框架模型部署的钥匙
2025-06-18 00:48

天空的星gho的博客文章为读者提供了从理论到实践的完整指南，帮助快速掌握ONNX在模型部署中的实际应用价值。
ONNX模型转换及可视化
2024-07-16 03:00

whaosoft143的博客目前开源的深度学习框架有很多，当我们在Github上搜索一个通用...然后调用TensorRT的SDK转换成uff格式，看上去好像也很顺畅没什么问题，它们的区别就在于训练生成的权重文件格式不同，不过反正最终都转换成uff格式。
如何将PyTorch Lighting模型部署到生产服务中
2021-01-29 11:28

ronghuaiyang的博客点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”作者：Caleb Kaiser编译：ronghuaiyang导读一篇用PyTorch Lighting提供模型服务的完全指南。纵...
轻松入门模型转换和可视化
2021-08-03 07:00

3Ｄ视觉工坊的博客点击上方“3D视觉工坊”，选择“星标”干货第一时间送达本文给大家介绍一个模型转换格式ONNX和可视化工具Netron。ONNX是微软设计的一种多平台的通用文件格式，帮助算法人员进行模型部署...
人工智能-开源大语言模型完整列表
2024-06-11 11:58

编程指南针的博客 Large Language Model (LLM) 即大规模语言模型，是一种基于深度学习的自然语言处理模型，它能够学习到自然语言的语法和语义，从而可以生成人类可读的文本。所谓"语言模型"，就是只用来处理语言文字（或者符号体系）...
所有开源大语言模型完整列表（最全！！可部署，建议收藏）
2024-08-05 13:44

是小杜吖.的博客 Large Language Model (LLM) 即大规模语言模型，是一种基于深度学习的自然语言处理模型，它能够学习到自然语言的语法和语义，从而可以生成人类可读的文本。所谓"语言模型"，就是只用来处理语言文字（或者符号体系）...
模型转换、模型压缩、模型加速工具汇总
2021-03-01 10:16

datayx的博客 # 将Tensorflow的resnet_v2_152模型转换为Pytorch支持的模型 mmdownload -f tensorflow -n resnet_v2_152 -o ./ mmconvert -sf tensorflow -in imagenet_resnet_v2_152.ckpt.meta -iw imagenet_resnet_v2_152.ckpt ...
通用-模型格式&文件格式&语言类型
2025-03-13 17:01

Felix_M.的博客加载：需要自定义逻辑读取 .bin 文件，并将其中的权重应用到模型结构中...保存：同样需要自定义逻辑将模型的权重保存为 .bin 文件。在格式转换上，由于 .bin 文件是非标准化的格式，因此转换过程需要根据具体的 .bin
全面解析机器学习与深度学习中的模型权重文件格式与应用场景
2025-05-15 12:30

知来者逆的博客模型权重文件格式在存储、共享和部署训练模型中的重要性日益...本文探讨了多种流行的模型权重文件格式，如PyTorch的.pt/.pth、TensorFlow的.ckpt、Keras的.h5、跨平台的.onnx等，分析了它们的起源、结构、用例及优势
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 10月23日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 6月28日

如何将PyTorch模型从ckpt转换为ONNX格式？

1条回答 默认 最新

一、PyTorch模型与ONNX格式简介

二、准备环境与依赖项

三、加载PyTorch模型检查点

四、构造输入张量

五、使用torch.onnx.export接口导出ONNX模型

六、验证ONNX模型正确性

七、常见问题与解决方案

八、进阶技巧与优化建议

问题事件

1条回答默认最新