修改的SSD—Tensorflow 版本在训练的时候遇到loss输入维度不一致

目前在学习目标检测识别的方向。

自己参考了一些论文对原版的SSD进行了一些改动工作

前面的网络模型部分已经修改完成且不报错。
但是在进行训练操作的时候会出现
’ValueError: Dimension 0 in both shapes must be equal, but are 233920 and 251392. Shapes are [233920] and [251392]. for 'ssd_losses/Select' (op: 'Select') with input shapes: [251392], [233920], [251392].
‘

‘两个形状中的尺寸0必须相等，但分别为233920和251392。形状有[233920]和[251392]。对于输入形状为[251392]、[233920]、[251392]的''ssd_losses/Select' (op: 'Select')

SSD loss function.

===========================================================================

def ssd_losses(logits, localisations,
gclasses, glocalisations, gscores,
match_threshold=0.5,
negative_ratio=3.,
alpha=1.,
label_smoothing=0.,
device='/cpu:0',
scope=None):
with tf.name_scope(scope, 'ssd_losses'):
lshape = tfe.get_shape(logits[0], 5)
num_classes = lshape[-1]
batch_size = lshape[0]

    # Flatten out all vectors!
    flogits = []
    fgclasses = []
    fgscores = []
    flocalisations = []
    fglocalisations = []
    for i in range(len(logits)):
        flogits.append(tf.reshape(logits[i], [-1, num_classes]))
        fgclasses.append(tf.reshape(gclasses[i], [-1]))
        fgscores.append(tf.reshape(gscores[i], [-1]))
        flocalisations.append(tf.reshape(localisations[i], [-1, 4]))
        fglocalisations.append(tf.reshape(glocalisations[i], [-1, 4]))
    # And concat the crap!
    logits = tf.concat(flogits, axis=0)
    gclasses = tf.concat(fgclasses, axis=0)
    gscores = tf.concat(fgscores, axis=0)
    localisations = tf.concat(flocalisations, axis=0)
    glocalisations = tf.concat(fglocalisations, axis=0)
    dtype = logits.dtype

    # Compute positive matching mask...
    pmask = gscores > match_threshold
    fpmask = tf.cast(pmask, dtype)
    n_positives = tf.reduce_sum(fpmask)

    # Hard negative mining...
    no_classes = tf.cast(pmask, tf.int32)
    predictions = slim.softmax(logits)
    nmask = tf.logical_and(tf.logical_not(pmask),
                           gscores > -0.5)
    fnmask = tf.cast(nmask, dtype)
    nvalues = tf.where(nmask,
                       predictions[:, 0],
                       1. - fnmask)
    nvalues_flat = tf.reshape(nvalues, [-1])
    # Number of negative entries to select.
    max_neg_entries = tf.cast(tf.reduce_sum(fnmask), tf.int32)
    n_neg = tf.cast(negative_ratio * n_positives, tf.int32) + batch_size
    n_neg = tf.minimum(n_neg, max_neg_entries)

    val, idxes = tf.nn.top_k(-nvalues_flat, k=n_neg)
    max_hard_pred = -val[-1]
    # Final negative mask.
    nmask = tf.logical_and(nmask, nvalues < max_hard_pred)
    fnmask = tf.cast(nmask, dtype)

    # Add cross-entropy loss.
    with tf.name_scope('cross_entropy_pos'):
        loss = tf.nn.sparse_softmax_cross_entropy_with_logits(logits=logits,
                                                              labels=gclasses)
        loss = tf.div(tf.reduce_sum(loss * fpmask), batch_size, name='value')
        tf.losses.add_loss(loss)

    with tf.name_scope('cross_entropy_neg'):
        loss = tf.nn.sparse_softmax_cross_entropy_with_logits(logits=logits,
                                                              labels=no_classes)
        loss = tf.div(tf.reduce_sum(loss * fnmask), batch_size, name='value')
        tf.losses.add_loss(loss)

    # Add localization loss: smooth L1, L2, ...
    with tf.name_scope('localization'):
        # Weights Tensor: positive mask + random negative.
        weights = tf.expand_dims(alpha * fpmask, axis=-1)
        loss = custom_layers.abs_smooth(localisations - glocalisations)
        loss = tf.div(tf.reduce_sum(loss * weights), batch_size, name='value')
        tf.losses.add_loss(loss)

研究了一段时间的源码（因为只是SSD-Tensorflow-Master中的ssd_vgg_300.py中定义网络结构的那部分做了修改，loss函数代码部分并没有进行改动）所以没所到错误所在，网上也找不到相关的解决方案。

希望大神能够帮忙解答
感激不尽~

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
w_xiaomu 2019-07-17 15:36
关注
你如果只有一个输出的，把中间for这行代码去掉，别的都不变，就可以了，如果输出的结果是多个，SSD的这种方式是正确的。

解决
无用 1
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

在Android上部署TensorFlowLite报错（官方的TensorFlowLite demo） android tensorflow 人工智能
2021-10-13 00:03

回答 1 已采纳你开墙只是电脑开墙吧？是不是没有另外设置android studio的代理或者设置Gradle的代理，没设置的话还是访问不通的
训练SSD解冻层的时候报错AttributeError: 'float' object has no attribute 'cpu' python 人工智能深度学习
2022-04-22 10:40

回答 1 已采纳 float是一个变量，咋能调用cpu呢，，你数据换了把？
tensorflow object detection API 模型训练最后开始训练，报错utf-8 python tensorflow 深度学习
2023-03-30 00:19

回答 1 已采纳给你找了一篇非常好的博客，你可以看看是否有帮助，链接：tensorflow问题：UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in
人工智能AI：TensorFlow Keras PyTorch MXNet PaddlePaddle 深度学习实战 part1
2019-09-03 23:11

あずにゃん的博客日萌社 github标星11600+：最全的吴恩达机器...Keras PyTorch MXNet TensorFlow PaddlePaddle 深度学习实战用户画像 C、C++笔记 JavaWeb+大数据笔记 CDH 6、CDH5 Python笔记链接：https://pan.baidu.com/s/1...
图像识别，输入特征图放大一倍导致loss震荡不收敛图像处理目标检测计算机视觉
2021-12-20 15:17

回答 2 已采纳输入大了四倍，其他卷积核数量、大小应该相应的调整，甚至可以考虑空洞卷积或怎加pooling、bn层等，减少一些多余信息，去除不必要的特征信息
Tensorflow object detection API 训练自己数据时报错 Windows fatal exception: access violation python tensorflow 机器学习神经网络
2019-06-22 17:00

回答 5 已采纳折腾了两天，最后折服了，降版本到1.12,-gpu，装cuda搞定，谢谢了
Caffe -SSD 训练报错，Cannot copy param 0 weights from layer 'conv1_1'; shape mismatch. caffe 目标检测
2018-10-30 03:34

回答 2 已采纳目测conv1_1的维度搞错了，一个是64 3 3 3，一个是64 4 3 3，要看你的代码，把多余的数据维度用切片切掉，或者把模型中conv1_1的维度补齐
TensorFlow 2019
2022-05-23 10:29

时轲的博客 TensorFlow框架图像案例 Machine Learning VS Deep Learning 1 特征提取方面自动 2 数量集量大/参数大 * 机器学习：朴素贝叶斯决策树深度学习：统称神经网络 3 应用图识别/自然语言处理/语言...
深度学习基于pytorch的SSD代码，进行训练数据集时报错（array Is 1-dimensional, but 2 were indexed）深度学习目标检测计算机视觉
2022-04-10 16:18

回答 2 已采纳数组是一维的, 但是你用了二维的索引
SSD训练迭代过程突然停止 python 有问必答深度学习神经网络
2021-05-10 11:19

回答 3 已采纳这个设置了input输入了吧？检测一下代码
关于#tensorflow#的问题，请各位专家解答！(语言-python) python tensorflow 深度学习
2023-02-02 21:07

回答 2 已采纳在 TensorFlow 中，你可以通过以下方法在训练过程中不显示网络的输出：设置 verbosity 参数：可以在调用 fit 方法时传递 verbosity=0 参数。这将完全禁止输出，仅显示重
深度学习框架 人工智能操作系统训练&前向推理 PyTorch Tensorflow MindSpore caffe 张量加速引擎TBE 深度学习编译器多面体 polyhedral AI集群框架
2024-04-03 18:34

EwenWanW的博客深度学习框架发展到今天，目前在架构上大体已经基本上成熟并且逐渐趋同。无论是国外的Tensorflow、PyTorch，亦或是国内最近开源的MegEngine、MindSpore，目前基本上都是支持EagerMode和GraphMode两种模式。
pycharm下ssd-tensoflow-master生成tfrecords_文件出现access violation 问题 pycharm tensorflow 目标检测
2022-03-17 15:33

回答 1 已采纳本人最后采用了pytorch实现了ssd nwpu数据集目标检测，这一方面问题暂时告一段落
tensorflow2.0建立MobilenetV3网络并进行训练与预测
2020-12-09 21:19

Ai_Taoism的博客 tensorflow2.0建立MobilenetV3网络并进行训练与预测Step1：前言Step2：建立bneck卷积块激活函数轻量级注意力模型bneck的建立Step3：构建MobilenetV3_small网络Step4：如何调用建立的MobilenetV3进行训练训练数据的...
各类深度学习框架详解+深度学习训练环境搭建-GPU版本
2023-10-23 09:55

fanstuck的博客对于人工智能工程师来说，搭建本地深度学习环境来说是比较麻烦的一件事，其中涉及到较多的相关硬件和软件的兼容问题。很多初学者安装的深度学习框架环境仅能够使用CPU运行并没有利用到GPU，关于很多硬件关联的深度...
没有解决我的问题, 去提问

悬赏问题

¥30 这是哪个作者做的宝宝起名网站
¥60 版本过低apk如何修改可以兼容新的安卓系统
¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
¥50 有数据，怎么建立模型求影响全要素生产率的因素
¥50 有数据，怎么用matlab求全要素生产率
¥15 TI的insta-spin例程
¥15 完成下列问题完成下列问题
¥15 C#算法问题, 不知道怎么处理这个数据的转换
¥15 YoloV5 第三方库的版本对照问题
¥15 请完成下列相关问题！

修改的SSD—Tensorflow 版本在训练的时候遇到loss输入维度不一致

SSD loss function.

===========================================================================

1条回答 默认 最新

悬赏问题

1条回答默认最新