背景:最近在做一个图像预测任务,图像并不是指常见的jpg等格式的图片,其实就是网格内每个像素点有数值的那种类似于热点图的图像,为raw文件;任务方面,按我的理解是一个风格迁移(本人新上手深度学习)。根据手头拿到的模型,我需要把多层(>64层,随机选择连续的64层)的原图像裁剪为(64,200,200)输入,输出与输入一致。
问题:模型训练完后,开始测试。假设原图尺寸为(130,224,224),我想把输出还原为原尺寸,再继续后续的评估。还原尺寸分两部分:
①(200,200)还原为(224,224):这个好办,原图周围本就是0,进行0填充就可;
②64层还原为130层:这个就是问题所在。我听到的建议是从头开始裁剪,然后将结果堆叠。那最后会有不足64层的部分该怎么办?
尝试:我尝试过将最后不足64层的部分填充0到64层再输入,将得出的结果裁掉填充的层数。但是这部分的预测结果是很差的。我的分析是:因为原图最后一层仍是有很大一部分像素点有值的,而下一层突变为全0层就会很突兀,从而对最后几层的预测结果有很大的影响。
搜网上也没找到类似的场景(也许是我自己不会浓缩表达这个问题),求解答!谢谢!!