yolov7为什么输入经过第一层卷积后长宽不变

Yolov7输入图像为6406403，为什么在backbond部分经过第一层卷积之后，输出的结果的长宽不变呢？难道不应该是（640-卷积核3）/步长1+1=638，即638*638吗

代码来源：https://blog.csdn.net/weixin_44791964/article/details/125827160

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
ChatGPTᴼᴾᴱᴺᴬᴵ 2023-10-09 22:56
关注
所有内容均由人工智能模型输出，其内容的准确性和完整性无法保证，不代表我的态度或观点。

该回答引用ChatGPT-3.5，仅为您提供参考，不保证完全正确
YOLOv7中的输入图像大小为640x640，并不是经过第一层卷积后长宽不变，而是有一个误解。通常，卷积神经网络中的卷积层会应用一种叫做"零填充"（zero-padding）的技巧，以保持输出特征图的尺寸与输入特征图相同。

在这个情况下，假设第一个卷积层的卷积核大小为3x3，步长为1，应用零填充时，计算输出特征图大小的公式为：

输出特征图的大小 = (输入特征图的大小 + 2 * 零填充 - 卷积核大小) / 步长 + 1

对于输入大小为640x640，零填充为0（即没有填充），卷积核大小为3x3，步长为1的情况：

输出特征图的宽度 = (640 + 2 * 0 - 3) / 1 + 1 = (640 - 3) + 1 = 638 + 1 = 639 输出特征图的高度 = (640 + 2 * 0 - 3) / 1 + 1 = (640 - 3) + 1 = 638 + 1 = 639

因此，第一个卷积层的输出特征图的大小为639x639，而不是638x638。这是因为输出特征图的尺寸是向下取整的结果，所以在这个例子中，输出的尺寸保持为639x639。这种零填充技巧有助于在卷积神经网络中保持输入和输出的空间维度一致，以便进行后续的计算和特征提取。

该回答引用NewBing，仅为您提供参考，不保证完全正确
YOLOv7是一种实时目标检测算法，它在输入图像上预测每个目标的边界框和类别概率。YOLOv7的网络结构由三个部分组成：backbone，neck和head¹。

backbone是用于提取图像特征的卷积神经网络，它可以是任何有效的CNN架构，如ResNet，EfficientNet等。YOLOv7使用了不同的backbone模型，如YOLOv7-W6使用了EfficientNet-B6²，YOLOv7-E6使用了EfficientNet-B7²等。

在backbone的第一层卷积后，输出的长宽不变，是因为使用了padding参数³。padding参数可以指定卷积层是否在输入图像的边缘添加额外的像素，以保持输出图像的尺寸不变。这样做的好处是可以避免边缘信息的丢失，同时也可以方便后续层的计算。

padding参数有两种常见的取值：valid和same³。valid表示不使用padding，即只对输入图像中能够完整覆盖卷积核的区域进行卷积操作，这样会导致输出图像的尺寸变小。same表示使用padding，即在输入图像的边缘添加适当数量的像素（通常为0），使得输出图像的尺寸与输入图像相同。

YOLOv7中使用了same padding⁴，因此在第一层卷积后，输出图像的长宽仍然为640640。具体来说，如果卷积核大小为33，步长为1，则在输入图像的四周各添加1个像素（总共4个像素），使得输入图像变为642642。然后对该图像进行卷积操作，得到输出图像为640640。

源: 与必应的对话， 2023/10/9
(1) GitHub - WongKinYiu/yolov7: Implementation of paper - YOLOv7: Trainable .... https://github.com/WongKinYiu/yolov7.
(2) YOLOv7: The Fastest Object Detection Algorithm (2023) - viso.ai. https://viso.ai/deep-learning/yolov7-guide/.
(3) 解读YOLO v7 - 知乎. https://zhuanlan.zhihu.com/p/549069736.

该回答引用文心一言，仅为您提供参考，不保证完全正确
在Yolov7的backbone部分，第一层卷积实际上执行的是一个3x3的卷积操作，这意味着输入图像的每个像素都会与3x3=9个卷积核进行卷积操作。在卷积的过程中，输入图像的大小并未发生改变，这是因为卷积操作是一种全连接层到卷积层（或者称为稀疏连接层）的转变。

在卷积操作中，每个卷积核都会在输入图像上滑动，并在每个位置计算其内部的乘积之和，这个结果就是输出图像中的一个像素。卷积核的大小（这里是3x3）和步长（这里是1）是卷积操作的超参数，这些参数可以控制输出图像的大小。

在你提供的代码中，（640-卷积核3）/步长1+1=638，这个公式实际上是有问题的。在卷积操作中，输出的图像大小并不直接由输入图像大小减去卷积核大小再除以步长来决定。实际上，输出的图像大小由以下公式决定：

output_height = (input_height - filter_height) / stride + 1

和

output_width = (input_width - filter_width) / stride + 1

在这个公式中，input_height和input_width是输入图像的大小，filter_height和filter_width是卷积核的大小，stride是步长。这个公式实际上是在计算在每个步长下，卷积核能够覆盖的输入图像的像素数量。

对于Yolov7的backbone部分的第一层卷积，由于步长为1，且卷积核大小为3，所以按照上述公式计算，输出的图像大小应该为（640-3）/1+1=638，和你之前的计算结果一致。但这个结果是在步长为1，且卷积核大小为3的情况下，如果步长或卷积核大小发生变化，输出的图像大小也会发生相应的变化。

需要注意的是，这里计算的是理论上的输出大小，实际的输出大小还取决于其他因素，如填充（padding）等。不过在大多数情况下，卷积操作并不会改变输入图像的大小。

该回答引用讯飞星火，仅为您提供参考，不保证完全正确
在YOLOv7中，第一层卷积后的长宽不变是因为采用了步长为1的卷积操作。这意味着在卷积过程中，每个像素点只与它的前一个像素点进行计算，而不是与整个输入图像的所有像素点进行计算。这样可以减小计算量，提高计算速度。

根据你提供的公式（640-卷积核3）/步长1+1=638，这里的计算过程是错误的。实际上，经过第一层卷积后，输出结果的长宽应该是（640-卷积核3）/步长2+1=638。这是因为在卷积操作中，每个卷积核都会覆盖输入图像的一部分区域，而步长决定了卷积核每次移动的距离。在这个例子中，步长为2，所以卷积核每次移动2个像素点。因此，经过第一层卷积后，输出结果的长宽应该是（640-卷积核3）/步长2+1=638。

该回答引用通义千问，仅为您提供参考，不保证完全正确
在YOLOv7中，输入图像的大小是640x640x3。在backbone部分的第一层卷积层中，使用的卷积核大小为3x3，步长为1，填充方式为“SAME”。

在卷积操作中，如果输入图像的大小是偶数，而卷积核的大小也是偶数，那么在进行卷积操作时，会使用“SAME”填充方式来保持输出图像的大小与输入图像的大小相同。在这种情况下，填充的方式是将输入图像的边界像素复制到输出图像的边界像素上，以保持输出图像的大小与输入图像的大小相同。

因此，在YOLOv7的backbone部分的第一层卷积层中，由于卷积核的大小为3x3，步长为1，输入图像的大小为640x640x3，因此使用“SAME”填充方式可以保持输出图像的大小与输入图像的大小相同，即640x640。

需要注意的是，如果输入图像的大小是奇数，而卷积核的大小也是奇数，那么在进行卷积操作时，会使用“VALID”填充方式，不进行填充，因此输出图像的大小会比输入图像的大小小一些。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

卷积后为什么会得到inf python 深度学习神经网络
2021-04-28 09:32

回答 1 已采纳你第六层的输出是12次方，会不会是溢出错误啊，为什么不进行一下BN那
有没有必要每层卷积后都接ReLU?
2020-12-13 23:14

回答 3 已采纳一般来说是需要的，神经网络为何如此强大的原因一部分就归结于其引入了激活函数，使得函数经过隐藏层之间的层层调用，变成了线性可分，神经网络为何如此强大的原因一部分就归结于其引入了激活函数，使得函数经过隐藏
请问卷积后图片尺寸不改变，是不是因为卷积周围补0了人工智能机器学习
2021-07-26 19:50

回答 1 已采纳 padding='same'你的因果关系搞错了，是先padding，然后才卷积的，而不是卷积之后补0。
三万字硬核详解：yolov1、yolov2、yolov3、yolov4、yolov5、yolov7
2023-01-08 00:57

胖墩会武术的博客（1.2）网络模型输入图像尺寸：448×448（固定值，与全连接层的输出大小有关），经过24个卷积与2个全连接层后，最后输出的特征图为7x7x30。在3x3的卷积后接1x1卷积，既降低了计算量，也提升了模型的非线性能力。 ...
如何让卷积神经网络中间的某几层参数固定，还不影响正常的训练过程? cnn 人工智能深度学习
2022-01-13 15:01

回答 1 已采纳可以啊，冻结之后只是不更新参数和计算梯度，优化器在step的时候遇到不计算梯度的话自动就不更新参数了，但是反向传播还是正常进行的。
卷积神经网络，全连接层就是一个全连接神经网络吗人工智能机器学习深度学习神经网络
2021-01-04 10:51

回答 1 已采纳所有各种层连接在一起被叫做神经网络，如果这个神经网络只有全连接层，则叫做全连接神经网络。 “通过这三个层次将一个多种颜色通道高像素的图片提取特征，进行简化，然后将简化的结果当作一个全连接神经网络的输
关于#神经网络#的问题：卷积神经网络中的池化过程，是对输入层池化，还是提取特征值后再池化人工智能机器学习神经网络
2022-06-17 00:31

回答 3 已采纳卷积神经网络结构决定它先利用卷积层提取特征，将提取的特征输入到池化层进行池化，和输入层没关系了
YOLOv7 Backbone| 原文源码详解
2022-12-06 23:28

Marlowee的博客 YOLOv7Backbone原文源码解读
请教一下长宽都是30怎么搭建卷积网络呢人工智能机器学习神经网络
2022-02-06 08:52

回答 2 已采纳一样的搭建啊，只不过你的30不好做，应该是32才对，这样相当于模型入口缩小4倍，这样你的全连接层的64x64x8就变成了16x16x8了，后面输出1000也可以一样缩小4倍，下面的都一样了，只要篇通道
使用yolov4训练时出现报错： cuDNN没有找到卷积的FWD算法深度学习目标检测计算机视觉
2023-02-10 00:52

回答 6 已采纳你这显示你的DarkNet中的cudnn是8.1.1的版本，这个和你说的8.6对不上。不过按理来说cudnn的影响不会很大（只要不是cudnn7.6.5和cudnn8.x这种大版本大区别就基本上没啥大
急！zy！要截止了！请问模板和图像进行二维卷积运算后，为什么新图像是空白的 matlab 图像处理
2021-10-23 22:29

回答 1 已采纳你好，你这个卷积核没有归一化，所以显示不了图像： d = imread('test.jpg'); d = rgb2gray(d); a1=conv2(a/sum(a(:)),d); imshow(a1
yolov7 网络架构深度解析
2022-07-20 22:04

所向披靡的张大刀的博客 yolov7网络结构深度解析
有关卷积运算以及池化层替代 python
2023-01-02 20:38

回答 1 已采纳使用较大的池化大小的卷积层 (a) 是一种替代池化层的方法。其他选项都不是替代池化层的方法。步幅是卷积核在输入数据上的滑动步长，是控制卷积输出大小的重要参数。使用较大的步幅 (d) 可以减少输出大小
YOLO系列详解：YOLOv1、YOLOv2、YOLOv3、YOLOv4、YOLOv5、YOLOv6、YOLOv7
2021-03-22 16:50

AI追随者的博客一、前言 YOLO系列是one-stage且是基于深度学习的回归方法，而R-CNN、Fast-RCNN、Faster-RCNN等是two-stage且是基于深度学习的分类方法。 YOLO官网：https://github.com/pjreddie/darknet 1.1 YOLO vs Faster R-...
YOLOv1---YOLOv5论文解读
2022-10-10 22:43

Jackie_AI的博客基于Python设计，OpenCV,SSD,CNN,机器学习,CNN,SVM,BP神经网络，数字识别,贝叶斯,逻辑回归,卷积神经网络等算法的中文文本分类....YOLOv1 出自 2016 CVPR 论文 You Only Look Once:Unified, Real-Time O
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 10月9日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月9日

悬赏问题

¥15 stc15f2k60s2单片机关于流水灯，时钟，定时器，矩阵键盘等方面的综合问题
¥15 YOLOv8已有一个初步的检测模型，想利用这个模型对新的图片进行自动标注，生成labellmg可以识别的数据，再手动修改。如何操作？
¥30 NIRfast软件使用指导
¥20 matlab仿真问题，求功率谱密度
¥15 求micropython modbus-RTU 从机的代码或库？
¥15 django5安装失败
¥15 Java与Hbase相关问题
¥15 后缀 crn 游戏文件提取资源
¥20 bash代码推送不上去 git fetch origin master #失败了
¥15 LOL外服加入了反作弊系统，现在游戏录像rofl文件离线都无法打开

yolov7为什么输入经过第一层卷积后长宽不变

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新