关于MINIST的GAN网络中归一化参数修改的问题

最近在学GAN，今天试着跑了一下网上的代码，但是看到网上没有一个选择用MINIST的0-1分布的归一化的，想着网络跑0-1分布的会快一点，就改了一下参数，改动如下：
把归一化的参数改成了0.1307和0.3081，把生成器最后一层的Tanh改成了Sigmoid。照理说这两个激活函数的性质差不多，为啥最后会不收敛呢？
改动后代码如下：

import torch.autograd
import torch.nn as nn
from torch.autograd import Variable
from torchvision import transforms
from torchvision import datasets
from torchvision.utils import save_image
import os
 
# 创建文件夹
if not os.path.exists('D:\pytorch_lx\GAN image'):
    os.mkdir('D:\pytorch_lx\GAN image')
 
 
def to_img(x):
    out = 0.3081*x+0.1307
    out = out.clamp(0, 1)  # Clamp函数可以将随机变化的数值限制在一个给定的区间[min, max]内：
    out = out.view(-1, 1, 28, 28)  # view()函数作用是将一个多行的Tensor,拼接成一行
    return out
 
 
batch_size = 128
num_epoch = 100
z_dimension = 100
# 图像预处理
img_transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((0.1307,), (0.3081,))  # (x-mean) / std
])
 
# mnist dataset mnist数据集下载
mnist = datasets.MNIST(
    root='D:\pytorch_lx\diabetes trainner', train=True, transform=img_transform, download=True
)
 
# data loader 数据载入
dataloader = torch.utils.data.DataLoader(
    dataset=mnist, batch_size=batch_size, shuffle=True
)
 
 
# 定义判别器  #####Discriminator######使用多层网络来作为判别器
# 将图片28x28展开成784，然后通过多层感知器，中间经过斜率设置为0.2的LeakyReLU激活函数，
# 最后接sigmoid激活函数得到一个0到1之间的概率进行二分类。
class discriminator(nn.Module):
    def __init__(self):
        super(discriminator, self).__init__()
        self.dis = nn.Sequential(
            nn.Linear(784, 256),  # 输入特征数为784，输出为256
            nn.LeakyReLU(0.2),  # 进行非线性映射
            nn.Linear(256, 256),  # 进行一个线性映射
            nn.LeakyReLU(0.2),
            nn.Linear(256, 1),
            nn.Sigmoid()  # 也是一个激活函数，二分类问题中，
            # sigmoid可以班实数映射到【0,1】，作为概率值，
            # 多分类用softmax函数
        )
 
    def forward(self, x):
        x = self.dis(x)
        return x
 
 
# ###### 定义生成器 Generator #####
# 输入一个100维的0～1之间的高斯分布，然后通过第一层线性变换将其映射到256维,
# 然后通过LeakyReLU激活函数，接着进行一个线性变换，再经过一个LeakyReLU激活函数，
# 然后经过线性变换将其变成784维，最后经过Tanh激活函数是希望生成的假的图片数据分布
# 能够在-1～1之间。
class generator(nn.Module):
    def __init__(self):
        super(generator, self).__init__()
        self.gen = nn.Sequential(
            nn.Linear(100, 256),  # 用线性变换将输入映射到256维
            nn.ReLU(True),  # relu激活
            nn.Linear(256, 256),  # 线性变换
            nn.ReLU(True),  # relu激活
            nn.Linear(256, 784),  # 线性变换
            nn.Sigmoid()  # Tanh激活使得生成数据分布在【-1,1】之间，因为输入的真实数据的经过transforms之后也是这个分布
        )
 
    def forward(self, x):
        x = self.gen(x)
        return x
 
 
# 创建对象
D = discriminator()
G = generator()
if torch.cuda.is_available():
    D = D.cuda()
    G = G.cuda()
 
 
# 首先需要定义loss的度量方式  （二分类的交叉熵）
# 其次定义 优化函数,优化函数的学习率为0.0003
criterion = nn.BCELoss()  # 是单目标二分类交叉熵函数
d_optimizer = torch.optim.Adam(D.parameters(), lr=0.0003)
g_optimizer = torch.optim.Adam(G.parameters(), lr=0.0003)
 
# ##########################进入训练##判别器的判断过程#####################
for epoch in range(num_epoch):  # 进行多个epoch的训练
    for i, (img, _) in enumerate(dataloader):
        num_img = img.size(0)
        # view()函数作用是将一个多行的Tensor,拼接成一行
        # 第一个参数是要拼接的tensor,第二个参数是-1
        # =============================训练判别器==================
        img = img.view(num_img, -1)  # 将图片展开为28*28=784
        real_img = Variable(img).cuda()  # 将tensor变成Variable放入计算图中
        real_label = Variable(torch.ones(num_img)).cuda()  # 定义真实的图片label为1
        fake_label = Variable(torch.zeros(num_img)).cuda()  # 定义假的图片的label为0
 
        # ########判别器训练train#####################
        # 分为两部分：1、真的图像判别为真；2、假的图像判别为假
        # 计算真实图片的损失
        real_out = D(real_img)  # 将真实图片放入判别器中
        d_loss_real = criterion(real_out.squeeze(-1), real_label)  # 得到真实图片的loss
        real_scores = real_out  # 得到真实图片的判别值，输出的值越接近1越好
        # 计算假的图片的损失
        z = Variable(torch.randn(num_img, z_dimension)).cuda()  # 随机生成一些噪声
        fake_img = G(z).detach()  # 随机噪声放入生成网络中，生成一张假的图片。 # 避免梯度传到G，因为G不用更新, detach分离
        fake_out = D(fake_img)  # 判别器判断假的图片，
        d_loss_fake = criterion(fake_out.squeeze(-1), fake_label)  # 得到假的图片的loss
        fake_scores = fake_out  # 得到假图片的判别值，对于判别器来说，假图片的损失越接近0越好
        # 损失函数和优化
        d_loss = d_loss_real + d_loss_fake  # 损失包括判真损失和判假损失
        d_optimizer.zero_grad()  # 在反向传播之前，先将梯度归0
        d_loss.backward()  # 将误差反向传播
        d_optimizer.step()  # 更新参数
 
        # ==================训练生成器============================
        # ###############################生成网络的训练###############################
        # 原理：目的是希望生成的假的图片被判别器判断为真的图片，
        # 在此过程中，将判别器固定，将假的图片传入判别器的结果与真实的label对应，
        # 反向传播更新的参数是生成网络里面的参数，
        # 这样可以通过更新生成网络里面的参数，来训练网络，使得生成的图片让判别器以为是真的
        # 这样就达到了对抗的目的
        # 计算假的图片的损失
        z = Variable(torch.randn(num_img, z_dimension)).cuda()  # 得到随机噪声
        fake_img = G(z)  # 随机噪声输入到生成器中，得到一副假的图片
        output = D(fake_img)  # 经过判别器得到的结果
        g_loss = criterion(output.squeeze(-1), real_label)  # 得到的假的图片与真实的图片的label的loss
        # bp and optimize
        g_optimizer.zero_grad()  # 梯度归0
        g_loss.backward()  # 进行反向传播
        g_optimizer.step()  # .step()一般用在反向传播后面,用于更新生成网络的参数
 
        # 打印中间的损失
        if (i + 1) % 100 == 0:
            print('Epoch[{}/{}],d_loss:{:.6f},g_loss:{:.6f} '
                  'D real: {:.6f},D fake: {:.6f}'.format(
                epoch, num_epoch, d_loss.data.item(), g_loss.data.item(),
                real_scores.data.mean(), fake_scores.data.mean()  # 打印的是真实图片的损失均值
            ))
        if epoch == 0:
            real_images = to_img(real_img.cpu().data)
            save_image(real_images, r'D:\pytorch_lx\GAN image\real_images.png')
    fake_images = to_img(fake_img.cpu().data)
    save_image(fake_images, r'D:\pytorch_lx\GAN image\fake_images-{}.png'.format(epoch + 1))
 
# 保存模型
torch.save(G.state_dict(), 'D:\pytorch_lx\GAN module\generator.pth')
torch.save(D.state_dict(), 'D:\pytorch_lx\GAN module\discriminator.pth')

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
星空下0516 2021-10-21 21:27
关注
sigmoid和和tanh两个函数虽然都是[0, 1]，但是你会发现他们的导数是不一样的，tanh的导数范围是[-1, 1], 而sigmoid的导数范围是[0, 0.25]，在反向传播的时候，sigmoid会很容易导致梯度消失，而不收敛。
有帮助，请采纳，谢谢！

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

关于MINIST的GAN网络中归一化参数修改的问题 python 人工智能
2021-10-21 20:18

回答 1 已采纳 sigmoid和和tanh两个函数虽然都是[0, 1]，但是你会发现他们的导数是不一样的，tanh的导数范围是[-1, 1], 而sigmoid的导数范围是[0, 0.25]，在反向传播的时候，sig
关于Tensorflow的minst数字识别出现name XXX is not defined的问题神经网络
2018-07-02 02:43

回答 3 已采纳你虽然在train（）函数中将 ``` learning_rate ``` 设为了全局变量，但是你在 > train_step = tf.train.GradientD
Pytorch机器学习在使用fashion-minist数据集是发生错误 python pytorch 有问必答机器学习
2021-07-04 11:08

回答 1 已采纳 np.array()只接收一个位置参数，而代码中有两个个，所以报错，numpy.array(object, dtype=None, copy=True, order='K', subok=False,
使用GAN生成图像：在 TensorFlow 中使用 GAN 生成图像
2023-12-29 05:00

新华的博客在给定图像数据集的情况下创建新颖的图像是称为生成对抗网络（GAN）的特定模型分支的优势之一。MNIST 是 GAN 的简单数据集，例如我们正在构建的数据集，因为它具有较小的单通道图像。生成器随机创建新颖的图像，而...
怎么理解X_train[y_train == i][0]？？？？ python tensorflow 人工智能机器学习神经网络
2019-10-21 19:27

回答 2 已采纳楼主可以试试先打印 X_train[y_train == i] 这个，这是一个推导式，返回 X_train 中满足 y_train ==i 条件的记录。后面那个 [0] 操作则是获取索引位置为 0
tensorflow CNN训练mnist数据集后识别自己写的数字效果不好 cnn tensorflow 神经网络
2018-04-15 16:32

回答 5 已采纳 MNIST数据集与你自己采集的图像，实际上是两个不同的数据集，你在MNIST上训练，然后在你的数据集上测试，测试性能不好是十分正常的。这实际上涉及在两个相似但是不同的域之间的迁移学习的问题。有三个办法
使用tensorflow-gpu无法训练模型？ python tensorflow ubuntu
2021-08-09 15:02

回答 2 已采纳看你的运行结果是你的cuda版本过于低，gpu的性能没有完全利用，观察你的loss几乎没有变化，loss要下降趋势才是正常运行结果，调整一下超参数试试
生成对抗网络GAN论文总结+复现代码(已完成28篇，未完待续。。。)
2022-01-06 13:21

iiiiiiimp的博客 GAN论文总结
12-1- GAN -简单网络-线性网络
2023-11-16 12:31

nutron-ma的博客随机噪声→生成器→MINIST图像。
从零构建神经网络-不使用框架（纯纯手撕）
2022-03-21 14:35

人工智能有点的博客一、从零构建神经网络-不使用框架（纯手撕） ...1.定义网络结构参数这里面节点个数比较好理解，重点在于weight_itoh 和weight_htoo 两个矩阵权重。 np.random.rand(self.hidden_nodes, self.input_
对抗网络（GAN）手写数字生成
2022-08-15 16:46

重邮研究森的博客对抗网络（GAN）生成手写数字图片
【深度学习实践】从零开始的炼丹生活11—— GAN的综述（2020.3）
2020-02-25 19:58

wby1905的博客一文了解 GAN 过去6年的各种思想以及经典架构，并展望未来。
【GAN】使用GAN进行mnist数据集中手写图片的生成
2020-05-11 10:23

uruz_L的博客一、GAN介绍 GAN一般有两个内容，一是生成器（generator），二是辨别器（discriminator）。辨别器的目的是：尽可能地分辨输入的数据是生成器生成的假数据还是真实的数据生成器的目的是：尽可能地骗过辨别器，...
PyTorch 手把手搭建(MNIST)神经网络
2022-03-26 10:05

小白学视觉的博客再看transforms.Normalize() 对一个tensor进行归一化，传入的两个参数为元组形式，分别为mean和std 相当于一个容器，将若干个transforms组合到一起。 2.4 DataLoader taet1 = datasets.MNIST('../data', train=True...
NNDL 实验六卷积神经网络（4）ResNet18实现MNIST
2022-11-06 20:05

五元钱的博客本文是使用经典经典网络ResNet18实现MNIST识别。
TensorFlow, Mxnet, PyTorch: 要点总结及常见神经网络代码实现
2019-07-09 07:13

luv_dusk的博客目录一、深度学习框架MxnetTensorFlow二、多层感知机 (MLP) (Mxnet+TensorFlow实现)三、卷积神经网络 (LeNet/AlexNet/VGG/NiN/GoogLeNet/ResNet) (Mxnet实现)四、循环神经网络 (RNN/GRU/LSTM) (Mxnet+TensorFlow实现...
【GAN ZOO阅读系列】UNSUPERVISED REPRESENTATION LEARNING WITH DCGAN 使用深度卷积生成对抗网络的无监督的表示学习
2018-09-23 22:38

hyczkg的博客 Alec Radford &amp;amp;amp;amp;amp;amp;amp;amp;...Facebook AI Research New York, NY soumith@fb.com 引用请注明出处原文链接https://arxiv.org/abs/1511.06434 参考翻译https:/...
Pytorch神经网络简单入门
2021-06-06 12:52

魅Lemon的博客文章目录一、框架说明二、GPU相关三、前置知识学习四、搭建第一个神经网络(回归)五、CNN卷积神经网络实现MNIST数据集六、RNN循环神经网络实现MNIST数据集七、AutoEncoder自编码八、GAN生成对抗网络九、DQN强化学习 ...
【零基础】从零开始学神经网络《python神经网络编程》——手写数字识别实战
2022-03-19 14:56

荒野火狐的博客随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。
PyTorch经验指南：技巧与陷阱
2021-05-27 20:50

Francis_Ye的博客目前，PyTorch也已经借助这种即时运行的概念成为最受欢迎的框架之一，开发者能快速构建模型与验证想法，并通过神经网络交换格式 ONNX在多个框架之间快速迁移。本文从基本概念开始介绍了 PyTorch 的使用方法、训练...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 10月30日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 10月22日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月21日

悬赏问题

¥15 sqlite 附加（attach database）加密数据库时，返回26是什么原因呢？
¥88 找成都本地经验丰富懂小程序开发的技术大咖
¥15 如何处理复杂数据表格的除法运算
¥15 如何用stc8h1k08的片子做485数据透传的功能？(关键词-串口)
¥15 有兄弟姐妹会用word插图功能制作类似citespace的图片吗？
¥200 uniapp长期运行卡死问题解决
¥15 latex怎么处理论文引理引用参考文献
¥15 请教：如何用postman调用本地虚拟机区块链接上的合约？
¥15 为什么使用javacv转封装rtsp为rtmp时出现如下问题：[h264 @ 000000004faf7500]no frame？
¥15 乘性高斯噪声在深度学习网络中的应用

关于MINIST的GAN网络中归一化参数修改的问题

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新