deeplab v3+训练loss不收敛问题

我使用的是官网的代码https://github.com/tensorflow/models/tree/master/research/deeplab 复现deeplab v3+；
训练数据就是标准的Pascal voc2012。训练之前已经按照官网上的说法，通过运行脚本download_and_convert_voc2012.sh下载voc2012数据、并将label转换为单通道、并将数据转换为需要的tfrecord格式；
训练模型也是从提供的model_zoo下载的https://github.com/tensorflow/models/blob/master/research/deeplab/g3doc/model_zoo.md；
学习率保持默认，即learning rate=0.0001；
Linux Ubuntu 16.04；TensorFlow1.6.0 installed from Anaconda；CUDA9.0/cudnn7.0.5；GeForce GTX 1080 Ti；
具体训练代码是：

python deeplab/train.py \
    --logtostderr \
    --training_number_of_steps=30000 \
    --train_split="train" \
    --model_variant="xception_65" \
    --atrous_rates=6 \
    --atrous_rates=12 \
    --atrous_rates=18 \
    --output_stride=16 \
    --decoder_output_stride=4 \
    --train_crop_size=513 \
    --train_crop_size=513 \
    --train_batch_size=2 \
    --dataset="pascal_voc_seg" \
    --fine_tune_batch_norm = False \
    --tf_initial_checkpoint="{下载的checkpoint路径}/deeplabv3_pascal_train_aug/model.ckpt.index" \
    --train_logdir="{要写入路径}/exp/train_on_train_set/train" \
    --dataset_dir="{数据集路径}/pascal_voc_seg/tfrecord"

然而loss一直不收敛：
最终出现nan值错误
如果训练的次数少一点，验证一下结果，发现miou只有零点零几：
一直没有找到原因，感觉步骤没有问题，也参照过各种博客，大家似乎都没有出现这种情况，希望大佬们可以帮忙

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
米虫 Ian 2018-12-26 09:22
关注
解决了。模型导入错误，应该导入model.ckpt而不是model.ckpt.index。唉我居然一直没发现真是傻了

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

耕地单目标语义分割实践——Deeplab3+语义分割
2023-08-31 14:54

doll ～CJ的博客本文主要复现了以mobileNetv2为主干特征提取网络的Deeplab3+语义分割模型。同时，对语义分割网络模型进行了部分文献整理，针对PSP块、逆残差块等网络结构进行了再学习。
PaddlePaddle DeepLab图像分割实战：城市街景标注
2025-12-26 07:14

Kay Lam的博客利用PaddlePaddle与DeepLabv3+构建高精度语义分割系统，解决城市街景中车道线、行人、交通标志等像素级识别问题。通过空洞卷积、ASPP模块和解码器结构提升细节感知能力，结合数据增强、模型压缩与工程调优实现高效...
语义分割知识点：UNet、FCN、SegNet、PSPNet、DeepLab系列
2024-04-21 00:15

FriendshipT的博客语义分割、UNet、FCN、SegNet、PSPNet、DeepLab
第20章：深度学习图像分割实战之UNet与DeepLabV3的对比分析【脊椎分割实验】
2025-05-07 10:20

听风吹等浪起的博客本文通过对比两种经典分割网络——UNet和DeepLabV3，分享一个完整的图像分割项目实现，包括数据预处理、模型训练、评估指标可视化和模型对比分析。可以自己将模型扩充多个，然后，这里填对应的json结果即可。
动态行为特征提取：基于深度学习的梅花鹿行为识别研究 人工智能 毕业设计 Python
2024-12-15 20:15

Mini_hailang_IT的博客首先，通过收集和标注梅花鹿的视频数据，构建了包含多种行为标签的训练数据集。接着，利用深度学习模型对动态行为进行特征提取和分类。在训练过程中，结合数据增强和迁移学习技术，以提高模型的泛化能力。实验结果...
在ISIC2016上实现DeepLabv3+
2024-07-01 21:50

残月西沉的博客 # Initialize model model = DeepLab(num_classes=1) # Assuming binary segmentation 3.3模型训练训练过程包括定义损失函数、优化器，并在每个训练周期中更新模型参数；具体步骤如下：（１）定义损失函数和优化...
11、利用人工智能进行植物病害识别
2025-09-26 06:41

kubernetes8ctl的博客本文探讨了利用人工智能特别是深度学习技术进行植物病害识别的现状与挑战。文章分析了影响模型鲁棒性的内外因素，强调了数据变异性、采集协议和标注质量的重要性，并详细介绍了从数据准备到模型训练的完整流程。通过...
Auto Seg-Loss: 自动损失函数设计
2022-06-29 11:40

小白学视觉的博客点击上方“小白学视觉”，选择加"星标"或“置顶”重磅干货，第一时间送达作者丨ILOAH@知乎来源丨https://zhuanlan.zhihu.com/p/266102401编辑丨极市平台导读本文所提出的Auto Seg-Loss的设计目的在于降低为了某个...
深度学习面试题——深度学习的技术发展史
2022-05-08 23:03

冰露可乐的博客 1）这个发展史是非常非常复杂的，重要的是论文的顶会发展史，各种网络层出不穷，各种改进陆陆续续，卷！...3）笔试求AC，可以不考虑空间复杂度，但是面试既要考虑时间复杂度最优，也要考虑空间复杂度最优。
DeepLab：高精度语义分割
2024-05-25 01:36

光子AI的博客计算机视觉是人工智能的一个重要分支，其目标是使计算机能够“理解”图像和视频的内容。语义分割作为计算机视觉中的一个重要任务，旨在将图像中的每个像素分类到预定义的语义类别中，例如人、车、道路、天空等。与...
没有解决我的问题, 去提问

deeplab v3+训练loss不收敛问题

1条回答 默认 最新

1条回答默认最新