qq_43332555 2022-03-08 15:10 采纳率: 100%
浏览 68
已结题

SINet语义分割,所有像素预测结果是同一个值

问题遇到的现象和发生背景

使用SINet进行二分类语义分割训练(https://openaccess.thecvf.com/content_CVPR_2020/papers/Fan_Camouflaged_Object_Detection_CVPR_2020_paper.pdf),

训练时:输入图片RGB,输入target像素值只有0和255的单通道黑白图,loss为nn.BCEWithLogitsLoss(),训练时loss有在下降,打印求loss之前的网络输出结果看到,每个像素预测结果-5到5之间。这样的话sigmoid之后的值在0-1之间,target像素值只有0和1,所有训练时没有问题。

但测试时:网络的预测值全都接近0,都为10的-1,-2次方,导致sigmoid之后的值全在0.5左右,transforms.ToPILImage()之后像素值全为213左右。不明白为什么。对训练集进行测试也是这种情况。

问题相关代码,请勿粘贴截图

https://github.com/DengPingFan/SINet

运行结果及报错内容

img


这是测试时打印的结果,cam1是网络预测的结果,cam2时sigmoid之后的结果,cam3是通过transforms.ToPILImage()将像素值调至0-255之后的结果

我的解答思路和尝试过的方法

怀疑是测试时对图片的预处理方式导致的,因此将测试时预处理方式调到和训练时相同,image=Image.open().convert('RGB')读取后,image = image.resize((512, 512), Image.BILINEAR),然后 transforms.ToTensor(), transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])]),都没有任何问题。
怀疑训练时多GPU并行运算导致?(瞎猜)但尝试单GPU后结果仍然不佳。
如果是图片前景面积过小导致类别不平衡,但训练时预测值也没问题。并且就算不平衡也不至于预测结果sigmoid之前全是0吧

我想要达到的结果

希望得到解答,找出可能错误的地方,不胜感谢

  • 写回答

2条回答 默认 最新

  • qq_43332555 2022-03-08 18:26
    关注
    问题已解决

    如果保存的模型是多GPU训练的,则load_state_dict()之前必须使用torch.nn.DataParallel()
    来源https://www.cnblogs.com/tofengz/p/13546902.html#_label5
    “踩坑记”

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 3月16日
  • 已采纳回答 3月8日
  • 创建了问题 3月8日

悬赏问题

  • ¥15 在若依框架下实现人脸识别
  • ¥15 网络科学导论,网络控制
  • ¥100 安卓tv程序连接SQLSERVER2008问题
  • ¥15 利用Sentinel-2和Landsat8做一个水库的长时序NDVI的对比,为什么Snetinel-2计算的结果最小值特别小,而Lansat8就很平均
  • ¥15 metadata提取的PDF元数据,如何转换为一个Excel
  • ¥15 关于arduino编程toCharArray()函数的使用
  • ¥100 vc++混合CEF采用CLR方式编译报错
  • ¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误,如何解决?
  • ¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载
  • ¥15 c#逐行读取txt文本,但是每一行里面数据之间空格数量不同