GAN生成彩色图片的效果不好？

GAN图片生成问题

最近在学习GAN，打算从一张图片开始试手，一开始用的mnist数据集第一张图片，网络训练10000次后效果挺好的，但是换了动漫人物头像就不行了。。

运行结果及报错内容

这是mnist训练10000次的结果

已经可以和原图无异了，然后随便找了一张二次元头像：

首先试了RGB三色的GAN，结果不理想：

然后用opencv将图片调成灰度图，训练单色，结果还是不理想：

大部分区域都是白色（我在plt.show的时候没有加cmap='gray'）
不知道是哪里出了问题

运行代码：

import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
from PIL import Image
import time
import cv2

# (x_train, y_train), (x_test, y_test) = tf.keras.datasets.mnist.load_data()
# real_image = x_train[0].reshape((1, 64, 64, 3))/255
x_train = Image.open("./20194292022539844.jpeg")
x_train = x_train.resize((64, 64))
x_train = np.array(x_train)
x_train = cv2.cvtColor(x_train, cv2.COLOR_BGR2GRAY)
real_image = x_train.reshape((1, 64, 64, 1))/255

# def Generator
def gen_generator():
    generator = tf.keras.models.Sequential([
        tf.keras.layers.Dense(256, input_shape=(64, 64, 1)),
        tf.keras.layers.BatchNormalization(),
        tf.keras.layers.LeakyReLU(),
        # tf.keras.layers.Reshape((-1,28,28)),
        tf.keras.layers.Conv2DTranspose(filters=64, kernel_size=(5, 5), strides=1 ,padding='same', use_bias=False),
        tf.keras.layers.BatchNormalization(),
        tf.keras.layers.LeakyReLU(),
        tf.keras.layers.Conv2DTranspose(filters=32, kernel_size=(5, 5), strides=1, padding='same', use_bias=False),
        tf.keras.layers.BatchNormalization(),
        tf.keras.layers.LeakyReLU(),
        tf.keras.layers.Conv2DTranspose(filters=1, kernel_size=(5, 5), strides=1, padding='same', use_bias=False, activation='tanh'),
    ])
    generator.summary()
    return generator

# def Discriminator
def gen_discriminator():
    discriminator = tf.keras.Sequential([
        tf.keras.layers.Conv2D(64,(5,5),strides = (2,2),padding = 'same', input_shape=(64, 64, 1)),
        tf.keras.layers.LeakyReLU(),
        tf.keras.layers.Dropout(0.2),
        tf.keras.layers.Conv2D(128,(5,5),strides = (2,2),padding = 'same'),
        tf.keras.layers.LeakyReLU(),
        tf.keras.layers.Dropout(0.2),
        tf.keras.layers.Flatten(),
        tf.keras.layers.Dense(1),
    ])
    discriminator.summary()
    return discriminator

g = gen_generator()     # create a generator
d = gen_discriminator() # create a discriminator
cross_entropy = tf.keras.losses.BinaryCrossentropy()
g_optimizer = tf.keras.optimizers.Adam(1e-4)
d_optimizer = tf.keras.optimizers.Adam(1e-4)

fake_image = tf.Variable(np.random.random(real_image.shape), dtype=tf.float32)     # generate a fake image

image_record = []

for i in range(10000):
    start = time.time()
    if i % 10 == 0:
        print(f'Time for epoch {i + 1} is {time.time() - start} sec')

    with tf.GradientTape(persistent=True) as g_tape, tf.GradientTape() as d_tape:      # create a record for one picture

        fake_image = g(fake_image, training=True)

        real_pred = d(real_image, training=True)       # use Discriminator to predict real_image
        fake_pred = d(fake_image, training=True)       # use Discriminator to predict fake_image

        # calculate loss
            # 1.generater loss
        generator_loss = cross_entropy(tf.ones_like(fake_pred), fake_pred) # or 1
        # Generator create fake image, and expects Discriminator predict fake image as True(1)

            # 2.discriminator loss
        real_loss = cross_entropy(tf.ones_like(real_pred), real_pred)   # Discriminator expects true image as True
        fake_loss = cross_entropy(tf.zeros_like(fake_pred), fake_pred)  # Discriminator expects fake image as False
        discriminator_loss = real_loss + fake_loss

        # g_tape.watch(generator_loss)
        # d_tape.watch(discriminator_loss)

    # gradient
    g_gradients = g_tape.gradient(generator_loss, g.trainable_variables)        # f'(g)
    d_gradients = d_tape.gradient(discriminator_loss, d.trainable_variables)    # f'(d)

    # assign weight
    g_optimizer.apply_gradients(zip(g_gradients, g.trainable_variables))    # use Adam to apply gradients(g_gradients) to trainable variables
    d_optimizer.apply_gradients(zip(d_gradients, d.trainable_variables))

    for_fake_image = (fake_image - tf.reduce_min(fake_image))/ (tf.reduce_max(fake_image) - tf.reduce_min(fake_image))
    image_record.append(for_fake_image.numpy().reshape((64, 64)))

count = 0
for j in range(len(image_record)):
    if j % 400 == 0:
        plt.subplot(5, 5, count+1)
        count += 1
        plt.axis('off')
        plt.imshow(image_record[j])
        plt.title(j)

不知道是哪个方面出了问题，对GAN网络一知半解😭还处于半懂半懵的状态，想解决完这个彩色图片生成的问题后尝试提高batch，希望有带佬指点一下！

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

报告相同问题？

关注问题

彩色星球图片生成1：使用Gan实现（pytorch版）
2021-04-09 18:11

starvapour的博客使用Gan实现彩色图片生成（pytorch版）1. 描述2. 代码2.1 模型代码2.2 训练代码3. 效果4. 趣图 1. 描述上一集：使用Gan实现MNIST数据集手写数字生成（pytorch版）在上一次的基础上，将代码扩展到理论上可以对任意...
深度学习：GAN图像生成
2024-10-01 00:57

Landy_Jay的博客生成对抗网络（GAN）的基本原理基于两个神经网络之间的博弈过程：一个生成器（Generator, G）和一个判别器（Discriminator, D）。输入-输出图像对指的是两个相关的图像，其中一个图像是另一个图像经过某种变换后的...
GAN图像生成-昇思25天打卡
2024-07-22 23:41

bearang的博客 GAN图像生成-昇思25天打卡
生成对抗网络---GAN
2024-01-03 22:19

心动雨崽的博客生成式对抗网络（）是一种深度学习...原始 GAN 理论中，并不要求 G 和 D 都是神经网络，只需要是能拟合相应生成和判别的函数即可。但实用中一般均使用深度神经网络作为 G 和 D。GAN在各种领域都有广泛的应用，包括等。
GAN：对抗生成网络【通俗易懂】
2024-04-14 12:10

In year的博客对抗生成网络（GAN）是一种深度学习模型，由两个神经网络组成：生成器G和判别器D。这两个网络被训练来协同工作，以生成接近真实数据的新样本。生成器的任务是接收一个随机噪声向量，并将其转换为与真实数据相似的假...
【百战GAN】如何使用GAN给黑白老照片上色？
2022-07-28 11:03

言有三的博客编辑 | 言有三本文资源与生成结果展示本文篇幅：7000字背景要求：会使用Python和Pytorch附带资料：参考论文和项目1 项目背景自从GAN技术发展以来，许多新奇的应用都得到了落地，本次我们来介绍其中一个小应用，就是...
【深度学习】生成对抗网络（GAN）生成海贼王图像 + PyTorch代码实现
2023-01-02 16:33

WSKH0929的博客本文基于Pytorch实现了GAN，并用于海贼王图像的生成。文章内提供了GAN教程和海贼王图像数据集的链接，配备有全部代码及其解释。
pytorch基于GAN生成对抗网络的数据集扩充
2021-11-24 00:14

programmer.Mr.Fei,的博客 GAN对抗生成网络可以在数据集量少不足的情况下，根据这部分少量的数据集的特征来生成更多的新的数据集达到数据集扩充的目的，把扩充生成的数据加入到其它模型的训练中可以增加其泛化能力。这篇文章前面部分先做个...
[人工智能-深度学习-58]：生成对抗网络GAN - 概述与常见应用
2021-12-12 00:57

文火冰糖的硅基工坊的博客 2.1 主要应用概述（图片、文本生成） 2.2图像样本数据的生成或数据增强 2.3隐私保护 2.4单幅图像超分辨率合成 2.5文本到图像合成 2.6 视频生成 2.7 风格迁移（图片或视频） 2.8 老照片或老视...
第G1周：生成对抗网络（GAN）入门
2024-02-28 11:29

Nobody33的博客代码知识点这部分代码导入了所需的库和模块，包括argparse用于解析命令行参数，os用于处理文件路径，numpy用于数值计算，torchvision.transforms用于图像变换，torchvision.utils中的save_image用于保存生成的图像，...
没有解决我的问题, 去提问