SRCNN，训练的效果很差，应该怎么改

我复现SRCNN的时候，不知道为什么model跑个200个epochs就没办法优化了，导致效果像抛硬币，有的图片提升了一丢丢，有的完全是变得更差了.
我用的训练图像是原作者提供的。

import numpy as np
from matplotlib import pyplot as plt
import sys
import keras
import cv2
import numpy
from keras.models import Sequential
from keras.layers import Conv2D
from keras.optimizers import Adam
from skimage.measure import compare_ssim as ssim
import cv2
import math
import random
from keras.callbacks import ModelCheckpoint
import os
from tensorflow.keras.callbacks import ModelCheckpoint


def psnr(target, ref):
    target_data = target.astype(float)
    ref_data = ref.astype(float)
    diff = ref_data - target_data
    diff = diff.flatten('C')
    rmse = math.sqrt(np.mean(diff ** 2.))

    return 20 * math.log10(255. / rmse)


def mse(target, ref):
    err = np.sum((target.astype('float') - ref.astype('float')) ** 2)
    err /= float(target.shape[0] * target.shape[1])
    return err


def compare_images(target, ref):
    scores = []
    scores.append(psnr(target, ref))
    scores.append(mse(target, ref))
    scores.append(ssim(target, ref, multichannel =True))
    
    return scores

def modcrop(img, scale):
    tmpsz = img.shape
    sz = tmpsz[0:2]
    
    # np.mod 是sz%scale
    sz = sz - np.mod(sz, scale)
    
    img = img[0:sz[0], 0:sz[1]]
    return img


def shave(image, border):
    "把周围去掉"
    img = image[border: -border, border: -border]
    return img


path = './Train'
deg=[]
ref=[]
# deg=np.array()
# ref = np.array()
count=0
for file in os.listdir('./Train'):
    if file != ".DS_Store":
        ref_e = cv2.imread(path+'/'+file)
        ref_e = cv2.cvtColor(ref_e, cv2.COLOR_BGR2YCrCb)

        ref_e=ref_e[:,:,1]
        ref_e=modcrop(ref_e,3)
#         size = ref_e.shape[0], ref_e.shape[1]
#         print(size)
        
        
        
        h = ref_e.shape[0]
        w = ref_e.shape[1]
        
        new_height = h // 2
        new_width = w // 2
        deg_e=cv2.resize(cv2.resize(ref_e,(new_width,new_height)),(w,h))
        
        temp1=np.zeros((32,32,1))
        temp2=np.zeros((20,20,1))
        
        for x in range(0,ref_e.shape[0]-33,14):
            for y in range(0,ref_e.shape[1]-33,14):
                temp1[:,:,0] = deg_e[x:x + 33 - 1, y:y + 33 - 1].astype(float) / 255;
                temp2[:,:,0] = ref_e[x + 6 : x + 6 + 21 - 1, y + 6 : y + 6 + 21 - 1].astype(float) / 255;
                deg.append(temp1)
                ref.append(temp2)
                
ref = np.array(ref)
deg = np.array(deg)


def model():

    SRCNN = Sequential()
    SRCNN.add(Conv2D(filters=64, kernel_size = (9, 9), activation='relu', padding='valid', use_bias=True, input_shape=(32, 32, 1)))
    SRCNN.add(Conv2D(filters=32, kernel_size = (3, 3), activation='relu', padding='same', use_bias=True))
    SRCNN.add(Conv2D(filters=1, kernel_size = (5, 5), padding='valid', use_bias=True))
    SRCNN.compile(optimizer='adam', loss='mean_squared_error', metrics=['mean_squared_error'])
    
    return SRCNN


checkpoint = ModelCheckpoint("SRCNN_check_1.h5", monitor='val_loss', verbose=1, save_best_only=True, save_weights_only=False, mode='min')
callbacks_list = [checkpoint]
history = srcnn.fit(deg,ref, validation_split=0.33, epochs=200, batch_size=128, verbose=1, callbacks=callbacks_list)


def predict(image_path):
    
    # load the degraded and reference images
    path, file = os.path.split(image_path)
    degraded = cv2.imread(image_path)
    ref = cv2.imread('Train/{}'.format(file))
    
    # preprocess the image with modcrop
    ref = modcrop(ref, 3)
    degraded = modcrop(degraded, 3)
    
    temp = cv2.cvtColor(degraded, cv2.COLOR_BGR2YCrCb)
    
    # create image slice and normalize  
    Y = numpy.zeros((1, temp.shape[0], temp.shape[1], 1), dtype=float)
    Y[0, :, :, 0] = temp[:, :, 0].astype(float) / 255
    
    srcnn.load_weights('SRCNN_check_1.h5')
    # perform super-resolution with srcnn
    pre = srcnn.predict(Y, batch_size=1)
    
    # post-process output
    pre *= 255
    pre[pre[:] > 255] = 255
    pre[pre[:] < 0] = 0
    pre = pre.astype(np.uint8)
    
    # copy Y channel back to image and convert to BGR
    temp = shave(temp, 6)
    temp[:, :, 0] = pre[0, :, :, 0]
    output = cv2.cvtColor(temp, cv2.COLOR_YCrCb2BGR)
    
    # remove border from reference and degraged image
    ref = shave(ref.astype(np.uint8), 6)
    degraded = shave(degraded.astype(np.uint8), 6)
    
    # image quality calculations
    scores = []
    scores.append(compare_images(degraded, ref))
    scores.append(compare_images(output, ref))
    
    # return images and scores
    return ref, degraded, output, scores


ref, degraded, output, scores= predict('train_lr/butterfly_GT.bmp')
print(degraded.shape)
print(output.shape)
print('Degraded Image: \nPSNR: {}\nMSE: {}\nSSIM: {}\n'.format(scores[0][0], scores[0][1], scores[0][2]))
print('Reconstructed Image: \nPSNR: {}\nMSE: {}\nSSIM: {}\n'.format(scores[1][0], scores[1][1], scores[1][2]))

fig, axs = plt.subplots(1, 3, figsize=(20, 8))
axs[0].imshow(cv2.cvtColor(degraded, cv2.COLOR_BGR2RGB))
axs[0].set_title('Degraded')
axs[1].imshow(cv2.cvtColor(output, cv2.COLOR_BGR2RGB))
axs[1].set_title('SRCNN')
axs[2].imshow(cv2.cvtColor(ref, cv2.COLOR_BGR2RGB))
axs[2].set_title('orginal')
# plt.savefig("test2.jpg")
# remove the x and y ticks
for ax in axs:
    ax.set_xticks([])
    ax.set_yticks([])

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
爱晚乏客游 2021-08-24 01:22
关注
这种问题如果原作者的代码没有问题的话，你的设置也没有问题的话，那么就是你的数据量的问题了，数据量是否足够大，分布是否合理？
还有一种你要看下原作者的效果能达到什么样子，有些时候就是网络的瓶颈在那里的，一旦是这种情况那么久需要你自己根据具体的问题修改一些参数了，这种最难了。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

【图像超分】论文复现：新手入门！Pytorch实现SRCNN，数据预处理、模型训练、测试、评估全流程详解，注释详细，简单修改就可以训练你自己的图像数据，有训练好的模型下载地址，随取随用
2024-03-11 11:10

十小大的博客【图像超分】论文精读：Image Super-Resolution Using Deep Convolutional Networks（SRCNN）请配合上述论文精读文章使用，效果更佳！图像超分辨率SRCNN和FSRCNN复现代码，除基本的网络实现外，还有特征图可视化，...
SRCNN超分辨率Pytorch实现，代码逐行讲解，附源码
2022-12-20 23:18

Jin、yz的博客图像超分辨率 1.SRCNN介绍训练过程损失函数个人对SRCNN训练过程的理解 2.实验常见问题和部分解读 1. torch.utils.data.dataloader中DataLoader函数的用法 2.SRCNN图像颜色空间转换原因以及方法？ 3. model....
AI人工智能、机器学习面试题（2022最新版）
2020-04-07 23:57

AI人工智能与大数据的博客 人工智能、机器学习面试题总结，侧重于理解，回答供参考，欢迎讨论。 General 深度学习（Deep Learning, DL）和机器学习（Machine Learning, ML）的关系是什么？深度学习是机器学习的子类，是利用深度神经网络...
【图像超分】论文复现：Pytorch实现FSRCNN，包含详细实验流程和与SRCNN的比较
2024-03-12 17:53

十小大的博客请配合上述论文精读文章使用，效果更佳！不想理解原理，希望直接跑通然后应用到自己的图像数据的同学，请直接下载上面的代码，有训练好的模型，直接用即可。具体使用方式见代码中的README！有问题来本文评论区留言！...
srcnn （Learning a Deep Convolutional Networkfor Image Super-Resolution）论文阅读笔记
2022-06-09 19:48

一壶浊酒..的博客 SRCNN论文阅读笔记
超分AI模型学习
2024-07-19 14:13

tiger119的博客超分（超分辨率：Super Resolution，SR）：是计算机视觉和图像处理领域的一个热门话题。...可以采用的方法和手段很多，最近项目中有涉及（红外成像的超分处理），将碰到的一些零散的知识整理了一下，记录一下。
【图像超分】论文复现：万字长文！Pytorch实现VDSR！血与泪的数据处理与训练过程总结！深度学习中的各种踩坑记录！适合各种深度学习新手！帮助你少走弯路！附PSNR最优的VDSR模型权重文件！
2024-03-18 10:16

十小大的博客【图像超分】论文精读：Accurate Image Super-Resolution Using Very Deep Convolutional Networks (VDSR)请配合上述论文精读文章使用，效果更佳！本文综合现有的VDSR相关代码，用pytorch实现极简风格的VDSR，复现...
OpenMMLab-AI实战营第二期——6-1. 底层视觉与MMEditing
2023-06-15 22:59

吨吨不打野的博客深度学习时代的超分辨率算法 3.1 SRCNN 3.1.1 基本网络模型 3.1.2 三个卷积层的作用 3.1.3 训练和评价 3.1.4 效果展示 3.1.5 缺点 3.2 FSRCNN（Fast SRCNN2016） 3.2.1 转置卷积 3.2.2 模型 3.2.3 FSRCNN的优势 ...
从SRCNN到EDSR，总结深度学习端到端超分辨率方法发展历程
2019-09-02 22:06

Chris_zhangrx的博客正如在VDSR论文中作者提到，输入的低分辨率图像和输出的高分辨率图像在很大程度上是相似的，也就是指低分辨率图像携带的低频信息与高分辨率图像的低频信息相近，训练时带上这部分会多花费大量的时间，实际上我们只...
用超分辨率扛把子算法 ESRGAN，训练图像增强模型
2021-05-13 00:02

AI科技大本营的博客最近邻插值法实现起来最简单粗暴，运算量也最小，只需要直接复制最近像素点的像素值进行填补即可，但是照搬旁边的像素最显著的特点就是效果差、块效应明显。将左图进行最近邻插值后，得到的右图产生了明显可见的...
深度学习在单图像超分辨率上的应用：SRCNN、Perceptual loss、SRResNet
2017-11-08 06:42

机器之心V的博客本文介绍了三种不同的卷积神经网络（SRCNN、Perceptual loss、SRResNet）在单图像超分辨率集上的实际应用及其表现对比，同时也探讨了其局限性和未来发展方向。单图像超分辨率技术涉及到增加小图像的大小，...
《图像超分》一些论文走读（SRCNN ，ESPCN ，VDSR ，SRGAN）
2021-08-12 19:30

星海千寻的博客更可喜的是，在AI领域，能看到很多中国名字的学者以及中国的贡献。 SRCNN （Learning a Deep Convolutional Network for Image Super-Resolution, ECCV2014）正所谓开山之作，现在看来这个架构是很简单的，因为...
深度学习在超分辨率重建上的应用SRCNN,FSRCNN,VDSR,DRCN,SRGAN
2019-02-26 11:28

俭任G的博客查看论文大部分都是基于单一插值下采样获得的低分辨率图像，这样的研究思路有很大的弊端：（1）插值方式对超分辨率结果有很大影响，训练集和测试集下采样方式不同结果相差较大；（2）单一插值下采样不符合退化...
【超分辨率（Super-Resolution）】关于【超分辨率重建】专栏的相关说明，包含专栏简介、专栏亮点、适配人群、相关说明、阅读顺序、超分理解、实现流程、研究方向、论文代码数据集汇总等
2024-03-25 15:50

十小大的博客算法模型从SRCNN开始更新至今，一般是一篇论文精读对应一篇论文复现。论文精读详解理论，归化繁为简，归纳核心，积累词句，培养阅读论文和论文写作能力。论文复现依托Pytorch代码，实现完整的模型训练流程，总结调参...
『超分辨率重建』从SRCNN到WDSR
2019-03-06 09:25

weixin_30585437的博客　本项目 fork 自网上开源项目，以 EDSR 算法为基准，在原工程基础上添加了 WDSR 算法，并部分添加了注释，训练方法在 /src/demo.sh 下记录，注意不要去执行这个文件，该文件里面记录了工程的各种启动方式，选择想要...
2020-10-18 从SRCNN到EDSR，总结深度学习端到端超分辨率方法发展历程
2020-10-18 22:01

weixin_41366701的博客超分辨率技术（Super-Resolution,...本文针对端到端的基于深度学习的单张图像超分辨率方法(Single Image Super-Resolution, SISR)，总结一下从SRCNN到EDSR的发展历程。(排列顺序大致按论文中给出的4倍上采样结果的峰值
从SRCNN到EDSR，总结深度学习端到端超分辨率方法发展历程（转）
2018-05-15 16:05

ch07013224的博客正如在VDSR论文中作者提到，输入的低分辨率图像和输出的高分辨率图像在很大程度上是相似的，也就是指低分辨率图像携带的低频信息与高分辨率图像的低频信息相近，训练时带上这部分会多花费大量的时间，实际上我们只...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月31日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 8月24日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
赞助了问题酬金 8月24日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
赞助了问题酬金 8月24日
展开全部

悬赏问题

¥15 Xsheii7我安装这个文件的时候跳出来另一个文件已锁定文件的无一部分进程无法访问。这个该怎么解决
¥15 unity terrain打包后地形错位，跟建筑不在同一个位置，怎么办
¥15 FileNotFoundError 解决方案
¥15 uniapp实现如下图的图表功能
¥15 u-subsection如何修改相邻两个节点样式
¥30 vs2010开发 WFP（windows filtering platform）
¥15 服务端控制goose报文控制块的发布问题
¥15 学习指导与未来导向啊
¥15 求多普勒频移瞬时表达式
¥15 如果要做一个老年人平板有哪些需求

SRCNN，训练的效果很差， 应该怎么改

1条回答 默认 最新

问题事件

悬赏问题

SRCNN，训练的效果很差，应该怎么改

1条回答默认最新