背景:本人最近在做一个图像预测任务,图像并不是指常见的jpg等格式的图片,其实就是网格内每个像素点有数值的那种类似于热点图的图像,为raw文件。模型的输入和标签如下(第一行为原数据,第二行为归一化后):
所用的模型为一个简单的3D-Unet,如下图。该图是文献里截取的,与我的任务的差别仅为输入通道和图像尺寸不一样。我的输入通道数为2(input=2),尺寸为32×256×256整图输入(经考虑后不采取patch输入,会出现训练块效应,同组做过该任务的师兄也是这么做的)。
问题:预测出的结果如下。很明显,看差异图可知预测结果总是在边缘会出现莫名的很高的值。尝试过加深网络和增加卷积层,但都无法解决。请教师兄得到的回答是采取不同loss的组合可能会有所效果。请问该如何解释和解决?或者说,针对边缘这种数值突变区域的预测有什么策略?