深度学习--使用自制数据在改进Unet上训练时loss，accuracy不变

训练数据用的是自制数据，如下所示，左图是输入数据，右图是输出标签

优化器选择adam，损失函数选择MSE，训练数据只有15张图片，测试图片有2张。

刚开始选择标准Unet训练数据，没有任何问题，后来在每层Unet中加入ResNet后loss从训练一开始就开始震荡。学习速率从1e-5~0.1之间都试过，batchsize从4~7之间也试过，但这个问题一直存在。

loss、accuracy都一直在震荡，情况如下图所示

想请教大佬们这种情况该怎么解决？

加入ResNet的网络结构代码如下

def Res_block(cov_input, filter_size):

    con_shortcut = Conv2D(filter_size, (1, 1), padding = 'same', kernel_initializer = 'he_normal')(cov_input)

    con1 = Conv2D(filter_size, (1, 1), activation = 'relu', padding = 'same', kernel_initializer = 'he_normal')(cov_input)
    con1 = BatchNormalization()(con1)
    con2 = Conv2D(filter_size, (3, 3), activation = 'relu', padding = 'same', kernel_initializer = 'he_normal')(con1)
    con2 = BatchNormalization()(con2)
    con3 = Conv2D(filter_size, (1, 1), padding = 'same', kernel_initializer = 'he_normal')(con2)

    con = Add()([con3, con_shortcut])
    con = Activation("relu")(con)
    cov_out = BatchNormalization()(con)

    return cov_out

def Unet(input_height = 224, input_width = 224, loss_names = "binary_crossentropy", optimizer_names = "adam"):

    main_inputs = Input(shape = (input_height, input_width, 6))

    # encode

     # 第一层
    conv1 = Res_block(main_inputs, 32)

    conv1 = Res_block(conv1, 32)

    pool1 = MaxPooling2D(pool_size = (2, 2), strides = (2, 2))(conv1)

    # 第二层
    conv2 = Res_block(pool1, 64)

    conv2 = Res_block(conv2, 64)

    pool2 = MaxPooling2D(pool_size = (2, 2), strides = (2, 2))(conv2)

    # 第三层
    conv3 = Res_block(pool2, 128)

    conv3 = Res_block(conv3, 128)

    pool3 = MaxPooling2D(pool_size = (2, 2), strides = (2, 2))(conv3)

    # 第四层
    conv4 = Res_block(pool3, 256)

    conv4 = Res_block(conv4, 256)

    pool4 = MaxPooling2D(pool_size = (2, 2), strides = (2, 2))(conv4)

    # 第五层
    conv5 = Res_block(pool4, 512)

    conv5 = Res_block(conv5, 512)

    pool5 = MaxPooling2D(pool_size = (2, 2), strides = (2, 2))(conv5)

    # 第六层
    conv6 = Res_block(pool5, 1024)

    conv6 = Res_block(conv6, 1024)

    # decode

    # 第七层
    up7 = (UpSampling2D((2, 2)))(conv6)
    up7 = Conv2D(512, 2, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal')(up7)
    conv7 = concatenate([up7, conv5], axis = -1)

    conv7 = Res_block(conv7, 512)

    conv7 = Res_block(conv7, 512)

    # 第八层
    up8 = (UpSampling2D((2, 2)))(conv7)
    up8 = Conv2D(256, 2, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal')(up8)
    conv8 = concatenate([up8, conv4], axis = -1)

    conv8 = Res_block(conv8, 256)

    conv8 = Res_block(conv8, 256)

    # 第九层
    up9 = (UpSampling2D((2, 2)))(conv8)
    up9 = Conv2D(128, 2, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal')(up9)
    conv9 = concatenate([up9, conv3], axis = -1)

    conv9 = Res_block(conv9, 128)

    conv9 = Res_block(conv9, 128)

    # 第十层
    up10 = (UpSampling2D((2, 2)))(conv9)
    up10 = Conv2D(64, 2, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal')(up10)
    conv10 = concatenate([up10, conv2], axis = -1)

    conv10 = Res_block(conv10, 64)

    conv10 = Res_block(conv10, 64)

    # 第十一层
    up11 = (UpSampling2D((2, 2)))(conv10)
    up11 = Conv2D(32, 2, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal')(up11)
    conv11 = (concatenate([up11, conv1], axis = -1))

    conv11 = Res_block(conv11, 32)

    conv11 = Res_block(conv11, 32)

    # 输出层
    o = Conv2D(32, (3, 3), activation = 'relu', padding = 'same', kernel_initializer = 'he_normal')(conv11)
    o = BatchNormalization()(o)

    o = Conv2D(32, (3, 3), activation = 'relu', padding = 'same', kernel_initializer = 'he_normal')(o)
    o = BatchNormalization()(o)

    o = Conv2D(16, (3, 3), activation = 'relu', padding = 'same', kernel_initializer = 'he_normal')(o)
    o = BatchNormalization()(o)

    o = Conv2D(16, (3, 3), activation = 'relu', padding = 'same', kernel_initializer = 'he_normal')(o)
    o = BatchNormalization()(o)

    o = Conv2D(8, (3, 3), activation = 'relu', padding = 'same', kernel_initializer = 'he_normal')(o)
    o = Conv2D(4, (3, 3), activation = 'relu', padding = 'same', kernel_initializer = 'he_normal')(o)
    o = Conv2D(2, (3, 3), activation = 'relu', padding = 'same', kernel_initializer = 'he_normal')(o)
    o = Conv2D(1, (3, 3), activation = 'relu', padding = 'same', kernel_initializer = 'he_normal')(o)
    o = Conv2D(1, (1, 1), activation = 'relu', kernel_initializer = 'he_normal')(o)

    model = Model(inputs = main_inputs, outputs = o)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2020-06-05 14:16
关注
说明你的数据样本不足，或者网络模型太复杂，学不动了，导致反复在一个值附近振荡。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

为什么loss和acc陡然下降如何调整为宜？(深度学习 影像分割分割二值分类 TensorFlow keras unet ) tensorflow 分类深度学习
2022-08-17 10:03

回答 9 已采纳数据增强使用CutMix和Cutout，其中CutMix就是将一部分区域cut掉但不填充0像素而是随机填充训练集中的其他数据的区域像素值，分类结果按一定的比例分配；Cutout:随机的将样本中的部分区
tensorflow-gpu进行3DUnet训练，jupyter出现服务重启？ tensorflow 人工智能机器学习深度学习神经网络
2020-04-28 10:03

回答 1 已采纳笔记本的显示卡散热不行，显存也小，所以不稳定。建议你找桌面GTX1060/1660以上的卡来测试。
训练unet参数没有更新深度学习神经网络计算机视觉
2022-08-25 08:28

回答 2 已采纳你应该说你的自定义损失函数有问题，然后上代码。参数没有更新：1、学习率为0，2、训练时设置了model.eval()，3、loss函数有误，导致weight的梯度为0
深度学习 Unet 实战分割项目：DUT-OMRON图像分割数据集（二值图像分割）
2024-02-04 21:19

本项目为 Unet 多尺度分割实战项目（包含数据集）数据集采用DUT-OMRON图像分割数据集（二值图像分割）数据集介绍：分为训练集、测试集，总大小为113MB 训练集：images图片目录+masks模板目录，4135张图片和4135个...
我看了这篇文章“使用ArcGis+Python(GDAL)制作语义分割遥感数据集”，这样做出的数据集只包括原图和标注图，能用于那些常见的语义分割模型进行训练吗 python 深度学习
2022-10-31 13:35

回答 3 已采纳一般来说，只是格式上面不同的话，转一下格式就可以了，分割数据集格式也有很多种，都是可以互相转换的，核心要素就是分割边缘轮廓点怎么输入到网络的问题，甚至你可以不用转，直接修改读取标注的方式也是可以的，不
使用Unet语义分割结果有虚影 python 人工智能有问必答
2021-08-20 21:51

回答 1 已采纳这个跟原始图片有关系吧你说的脏是周围有模糊的噪点吗，那可以尝试在调用Unet分割前对图片进行一定的预处理步骤如高斯平滑消除高频噪音，进行平滑和模糊形态学操作：腐蚀、膨胀、开闭、白帽子黑帽子等去掉一
transunet对于小样本效果是否不如unet cnn transformer 深度学习
2022-03-22 23:34

回答 1 已采纳越是大模型，越需要预训练，不然容易过拟合。
UNet_GaN_UNet_u-net_深度学习Unet_
2021-10-04 04:16

很多时候深度学习的结构需要大量的sample和计算资源，但是U-Net基于FCN（Fully Convultional Neural Network：全卷积神经网络）进行改进，并且利用数据增强（data augmentation）可以对一些比较少样本的数据进行训练...
yolov5中The size of tensor a (80) must match the size of tensor b (56) at non-singleton dimension 3 python 深度学习目标检测
2022-03-20 14:40

回答 1 已采纳下载： https://github.com/ultralytics/yolov5/releases/download/v5.0/yolov5s.pt 替换默认下载的yolov5s.pt，因为默认下载
关于labelme标注的json文件转png图片的疑问人工智能机器学习深度学习神经网络
2019-12-25 09:09

回答 3 已采纳太久了，自己百度下，好像有个博客专门提到这点，他的代码是可以实现这个目的的。你也可以看看这个博客：https://blog.csdn.net/yangshuai66666666/article/de
关于图像预测边缘值过高的问题 python 图像处理深度学习
2022-11-09 10:07

回答 2 已采纳 1.从原理上来说，边缘信息本身就是一个很重要的信息，从梯度变换上面来说，像你这种边缘信息比内部的黄色到红色的梯度差距更大。2.我没用过3Dnet，不晓得你图像预处理是怎么做的，像一些2D的目标检测和实
深度学习-语义分割-基于UNet
2023-06-14 18:32

基于UNet结构的语义分割模型，开箱即可使用，从训练到预测，有保姆级教程，可以改变模型大小参数，使得模型可以在Jetson Nano上得到25fps速度。
特征图可视化——模型加载深度学习
2021-12-01 11:28

回答 2 已采纳我们首先定位问题，应该是出现在model上面，你再检查下你模型的forward(self,xx,xx)到底是几个参数，还有forward返回的值是几个。result, all_dict = model
UNet 深度学习训练数据集
2023-05-16 16:14

UNet 深度学习训练数据集，可用于 UNet 网络搭建模型训练。
分割-Unet+Pytorch实现训练自定义数据集-算法训练-优质项目实战.zip
2024-02-19 11:47

分割_Unet+Pytorch实现训练自定义数据集_算法训练_优质项目实战
没有解决我的问题, 去提问

悬赏问题

¥15 关于#windows#的问题：怎么用WIN 11系统的电脑克隆WIN NT3.51-4.0系统的硬盘
¥15 matlab有关常微分方程的问题求解决
¥15 perl MISA分析p3_in脚本出错
¥15 k8s部署jupyterlab，jupyterlab保存不了文件
¥15 ubuntu虚拟机打包apk错误
¥199 rust编程架构设计的方案有偿
¥15 回答4f系统的像差计算
¥15 java如何提取出pdf里的文字？
¥100 求三轴之间相互配合画圆以及直线的算法
¥100 c语言，请帮蒟蒻写一个题的范例作参考

深度学习--使用自制数据在改进Unet上训练时loss，accuracy不变

2条回答 默认 最新

悬赏问题

2条回答默认最新