yolov4权重文件.pth转.weight

求一个把yolov4在pytorch中训练的.pth权重文件转为在darknet中训练的.weight权重文件的脚本

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

CSDN-Ada助手 CSDN-AI 官方账号 2023-04-26 09:10

关注

不知道你这个问题是否已经解决, 如果还没有解决的话:

这篇博客也许可以解决你的问题👉 ：yolov3（pytorch）训练问题，完美解决./darknet无法运行问题

除此之外, 这篇博客: YOLOv3 损失函数详解【论文笔记 + pytorch实现附.pth权重文件】中的 2 Darknet-53网络结构 部分也许能够解决你的问题, 你可以仔细阅读以下内容或者直接跳转源博客中阅读:

首先回想一下

YOLOv2中提出的Darknet-19网络结构作为主干特征提取网络。考虑到对于小物体的检测，结合FPN（特征金字塔）的思想，YOLOv2简单添加一个 passthrough layer，把浅层特征图（分辨率为26 × 26，即提取特征图的倒数第二卷积层结果）连接到深层特征图。通过把高低分辨率的特征图做连结，叠加相邻特征到不同通道（而非空间位置），类似于ResNet中的identity mappings。

在YOLOv3中，作者可能觉得Darknet-19网络还是不够深（因为更深的网络结构可以学习到更加丰富的特征），故再次借鉴ResNet网络和FPN（特征金字塔）的思想，提出了Darknet-53网络结构，如下图所示（图片来源）。
Darknet53中的Residual Block进行一次3X3、步长为2的卷积，然后保存该卷积结果layer；再进行一次1X1的卷积和一次3X3的卷积，并把这个结果加上layer作为最后的结果。残差网络的特点是容易优化，并且能够通过增加相当的深度来提高准确率。其内部的残差块使用了跳跃连接，缓解了在深度神经网络中增加深度带来的梯度消失问题。

上图中左半部分虚线框内即为Darknet-53网络机构，可以看到该网络结构的输入为 416×416×3，之后通过一个3×3的卷积层来扩增通道数。接下来通过堆叠一系列Residual Block来构建网络，其具体个数为[1, 2, 8, 8, 4]，最终主干网络输出大小为13×13、26×26、52×52三个大小的特征图，目的是可以检测到图像中更小的物体。特征图分割越密集，则每一个特征点相对于原图中的区域越小，从而可以监测到更小的物体。

下图为9种先验框的尺寸，其中蓝色框为聚类得到的先验框。黄色框是ground truth，红框是检测对象中心点所在的网格。

Darknet-53主干网络代码如下：

import torch
import torch.nn as nn
import math
from collections import OrderedDict

# 基本的darknet块

class BasicBlock(nn.Module):
    def __init__(self, inplanes, planes):  # resnet block中是 先进行一个1×1卷积 再进行一个3×3卷积
        super(BasicBlock, self).__init__()
        self.conv1 = nn.Conv2d(inplanes, planes[0], kernel_size=1,  # 1×1卷积目的是下降通道数
                               stride=1, padding=0, bias=False)
        self.bn1 = nn.BatchNorm2d(planes[0])
        self.relu1 = nn.LeakyReLU(0.1)
        
        self.conv2 = nn.Conv2d(planes[0], planes[1], kernel_size=3,  # 3×3卷积目的是扩张通道数，注意这里并不减少特征图的大小！！
                               stride=1, padding=1, bias=False)      # 这样做可以帮助减少参数量
        self.bn2 = nn.BatchNorm2d(planes[1])
        self.relu2 = nn.LeakyReLU(0.1)

    def forward(self, x):
        residual = x

        out = self.conv1(x)
        out = self.bn1(out)
        out = self.relu1(out)

        out = self.conv2(out)
        out = self.bn2(out)
        out = self.relu2(out)

        out += residual
        return out

class DarkNet(nn.Module):
    def __init__(self, layers):
        super(DarkNet, self).__init__()
        self.inplanes = 32
        self.conv1 = nn.Conv2d(3, self.inplanes, kernel_size=3, stride=1, padding=1, bias=False)  # 第一个卷积 3->32
        self.bn1 = nn.BatchNorm2d(self.inplanes)
        self.relu1 = nn.LeakyReLU(0.1)

        self.layer1 = self._make_layer([32, 64], layers[0])
        self.layer2 = self._make_layer([64, 128], layers[1])
        self.layer3 = self._make_layer([128, 256], layers[2])
        self.layer4 = self._make_layer([256, 512], layers[3])
        self.layer5 = self._make_layer([512, 1024], layers[4])

        self.layers_out_filters = [64, 128, 256, 512, 1024]

        # 进行权值初始化
        for m in self.modules():
            if isinstance(m, nn.Conv2d):
                n = m.kernel_size[0] * m.kernel_size[1] * m.out_channels
                m.weight.data.normal_(0, math.sqrt(2. / n))
            elif isinstance(m, nn.BatchNorm2d):
                m.weight.data.fill_(1)
                m.bias.data.zero_()

    def _make_layer(self, planes, blocks):  # 进行下采样且不断堆叠残差块
        layers = []
        # 下采样，步长为2，卷积核大小为3，用于减少特征图尺寸
        layers.append(("ds_conv", nn.Conv2d(self.inplanes, planes[1], kernel_size=3,
                                stride=2, padding=1, bias=False)))
        layers.append(("ds_bn", nn.BatchNorm2d(planes[1])))
        layers.append(("ds_relu", nn.LeakyReLU(0.1)))
        # 加入darknet模块   
        self.inplanes = planes[1]
        for i in range(0, blocks):
            layers.append(("residual_{}".format(i), BasicBlock(self.inplanes, planes)))
        return nn.Sequential(OrderedDict(layers))

    def forward(self, x):
        x = self.conv1(x)
        x = self.bn1(x)
        x = self.relu1(x)

        x = self.layer1(x)
        x = self.layer2(x)
        out3 = self.layer3(x)
        out4 = self.layer4(out3)
        out5 = self.layer5(out4)

        return out3, out4, out5

# pretrained为权重文件路径
def darknet53(pretrained, **kwargs):
    model = DarkNet([1, 2, 8, 8, 4])
    if pretrained:
        if isinstance(pretrained, str):
            model.load_state_dict(torch.load(pretrained))
        else:
            raise Exception("darknet request a pretrained path. got [{}]".format(pretrained))
    return model

网络结构的右半部分包括将主干网络Darknet-53的输出进行生成特征金字塔。具体做法为首先将13×13×1024的特征层进行上采样变为26×26×256，再与26×26×512的特征层进行堆叠，其结果为26×26×768大小的特征；同理，大小为52×52×256的特征层与下一层网络堆叠后的结果为52×52×384。
对于这三个堆叠后的结果，分别在进行5次卷积操作，最后接上一个3×3的卷积和1×1的卷积，用于输出预测结果，三个层对应的输出结果大小分别为13×13×75、26×26×75、52×52×75。其中75 = (4+1+20)×3，4表示一个边界框对应的调整参数x, y, w, h，1表示置信度，20表示VOC数据集分为20个类，3表示特征图上的每一个点对应有3个anchor。

以下回答来自chatgpt:
我可以为您提供一份将yolov4在pytorch中训练所得的.pth权重文件转换为darknet中训练所需的.weight权重文件的脚本。

首先，您需要安装好Pytorch和Darknet框架，并下载好权重文件。

步骤如下：

1.新建weights文件夹，在其中放入pytorch训练得到的.pth权重文件和darknet的配置文件。请确保配置文件和权重文件的名称和路径与下面的代码中相对应。

2.在终端中运行以下代码：
```
pip install pytorch2darknet

# 导入相关库
import pytorch2darknet

# 输入pytorch权重文件路径和darknet的cfg配置文件路径，生成相应的.darknet权重文件
pytorch2darknet.pytorch_2_darknet('path_to_pytorch_weights.pt', 'path_to_darknet_cfg.cfg', output_path='output_path_to_weights.weight')
```
将上述代码中的“path_to_pytorch_weights.pt”替换为pytorch训练得到的.pth权重文件的路径；将“path_to_darknet_cfg.cfg”替换为darknet配置文件的路径；将“output_path_to_weights.weight”替换为将要输出的权重文件的路径。

提醒：如果您使用的不是yolov4，而是其他版本的yolo，请将以上过程中的“darknet.cfg”文件换成您所使用yolo对应的cfg文件。

希望能对您有所帮助！

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^

报告相同问题？

关注问题

yolo训练出来的pt和pth文件怎么用于微信小程序 python 微信小程序有问必答深度学习
2022-03-17 17:08

回答 2 已采纳 pt/pth->onnx->ncnn然后部署可以用ncnn部署在安卓app上面，不过我没试过小程序和安卓的app部署，不知道这两个区别，这个得你自己去研究了，直接用app运行是可以的。你可
模型参数量与保存的.pth大小一定正相关吗深度学习神经网络计算机视觉
2023-03-03 13:41

回答 2 已采纳是因为profile()这个函数计算参数量不准么。。
运行FairMOT demo.py时出现../models/hrnetv2_w18_imagenet_pretrained.pth is not exist!报错，请问有没有大佬可以解答一下？ python
2020-09-07 17:12

回答 2 已采纳检查路径还是
pycharm下python使用yolov3/yolov3-tiny训练好的权重文件.weights进行行人检测，批量测试自定义文件夹下的图片并输出至指定文件夹
2020-12-21 13:50

在本文中，我们将探讨如何在PyCharm环境下利用Python结合YOLOv3或YOLOv3-tiny模型，使用预先训练好的权重文件进行行人检测，并批量处理自定义文件夹中的图片，将检测结果输出到指定文件夹。这个过程对于目标识别和...
No such file or directory: 'saved_model_weight/resnet34_pretrain_ori_low_torch_version.pth' python pytorch 深度学习
2022-07-13 22:40

回答 2 已采纳 FileNotFoundError: [Errno 2] No such file or directory: 'saved_model_weight/resnet34_pretrain_ori_lo
pycharm中报错PermissionError: [Errno 13] Permission denied:'EfficientFace_Trained_on_AffectNet8.pth' python 语音识别
2022-04-28 21:07

回答 2 已采纳 EfficientFace_Trained_on_AffectNet8.pth 右键看看属性，有可能文件处于打开状态 #检查一下文件 import torch pthfile = r’D:\deep
pth转onnx报错：AttributeError: 'collections.OrderedDict' object has no attribute 'shape' python pytorch 有问必答深度学习
2022-03-19 12:41

回答 2 已采纳从报错看，是因为utl_param.values()和own_state.values()这些变量是odict类型，无shape属性，检查这两个变量，将其转换成np的ndarray或pd的Series
❀yolov5的学习 ❀关于代码的文件类型
2021-12-12 11:07

夏天｜여름이다的博客一种用来写配置文件的序列化语言，跟json有些像，yaml又称作json的超集，yaml的设计则是为了友好可读性，主要用于配置信息的书写，而json设计的目的则是为了简单和通用，主要用于存储数据和应用层数据通信使用。...
Perfect Pth Powers
2017-09-08 03:10

回答 1 已采纳 http://blog.csdn.net/lianai911/article/details/39494291
pt模型转torchscript模型 pytorch 人工智能深度学习
2022-05-05 21:26

回答 1 已采纳 torch.jit.save — PyTorch 1.11.0 documentation
mmdetection test的结果都是0.000x python 深度学习目标检测
2022-07-22 09:29

回答 1 已采纳 test数据和你train的数据是不是不太搭?看样子像是数据问题
pytorchyolov4训练_PyTorch版YOLOv4更新了，不仅适用于自定义数据集，还集成了注意力和MobileNet...
2020-12-22 18:38

weixin_39609407的博客距离 YOLO v4 的推出，已经过去 5 个多月。YOLO 框架采用 C 语言作为底层代码，这对于惯用 Python 的研究者来说，...从今年 4 月 YOLOv4 发布后，对于这个目标检测框架，问的最多的问题或许就是：「有没有同学复现 Y...
train.py: error怎么解决 python 深度学习神经网络
2021-06-04 16:22

回答 1 已采纳配置文件路径的参数没传，运行时输入一下命令： python train.py --cfg '配置文件的路径名'
yolov5目标检测和QT 6.6.0 基于OpenCV加载yolov5.onnx模型文件实现目标检测
2024-08-18 18:40

Keep_Trying_Go的博客 QT6.6.0加载yolov5的ONNX模型文件进行目标检测目标检测拓展应用两款IP Camera+YOLOV3进行目标检测（手机摄像头作为电脑摄像头使用）使用pytorch实现预训练模型迁移学习中的目标检测使用MobileNet_SSD进行目标检测...
睿智的目标检测66——Pytorch搭建YoloV8目标检测平台
2023-05-15 00:13

Bubbliiiing的博客又搞了个YoloV8，看起来似乎在抢这个名字。YoloV8所使用的主干特征提取网络主要为速度快做了一些优化：1、颈部结构使用普通的步长为2的3x3卷积。YoloV5最初使用了Focus结构来初步提取特征，在改进后使用了大卷积核的...
睿智的目标检测61——Pytorch搭建YoloV7目标检测平台
2022-09-26 22:40

Bubbliiiing的博客 AB哥弄了个YoloV7，我觉得有必要跟进看看，它的concat结构还是第一次见，感觉有点意思。 https://github.com/bubbliiiing/yolov7-pytorch 1、主干部分：使用了创新的多分支堆叠结构进行特征提取，相比以前的Yolo，...
睿智的目标检测——Pytorch搭建YoloV7-OBB旋转目标检测平台
2023-02-05 15:08

_白鹭先生_的博客在YOLOv7的基础上使用KLD损失修改为旋转目标检测YOLOv7-OBB。
睿智的目标检测——Pytorch搭建YoloV7-Tiny-OBB旋转目标检测平台
2023-02-17 20:15

_白鹭先生_的博客在YOLOv7-Tiny的基础上使用KLD损失修改为旋转目标检测YOLOv7-Tiny-OBB。
超级检测器目标检测算法解析
2023-08-08 01:05

光剑书架上的书的博客相比之下，YOLOv3使用anchor box的方法，将目标的不同尺寸固定下来，不需要针对不同目标分别设计参数，就可以有效地解决这个问题。通过预测输出特征图上的每个cell是否包含目标以及该目标的边界框和分类概率，可以...
基于卷积神经网络(Convolutional Neural Network, CNN) 的一种高级物体检测技术，通过对深度学习、目标检测、Faster-RCNN等相关技术进行研究及实践，实现物体检测
2023-08-04 01:16

光剑书架上的书的博客物体检测(Object detection) 是计算机视觉领域中一个重要任务，该任务旨在从图像或视频中...目前已有许多物体检测模型被广泛应用，如YOLOv3、SSD等。然而，这些模型仍存在一些局限性，特别是在小目标上的检测能力较差。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 4月27日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
赞助了问题酬金15元 4月26日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月25日

悬赏问题

¥200 csgo2的viewmatrix值是否还有别的获取方式
¥15 Stable Diffusion，用Ebsynth utility在视频选帧图重绘，第一步报错，蒙版和帧图没法生成，怎么处理啊
¥15 请把下列每一行代码完整地读懂并注释出来
¥15 pycharm运行main文件，显示没有conda环境
¥15 易优eyoucms关于二级栏目调用的问题
¥15 寻找公式识别开发，自动识别整页文档、图像公式的软件
¥15 为什么eclipse不能再下载了？
¥15 编辑cmake lists 明明写了project项目名，但是还是报错怎么回事
¥15 关于#计算机视觉#的问题：求一份高质量桥梁多病害数据集
¥15 特定网页无法访问，已排除网页问题

yolov4权重文件.pth转.weight

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新