GAN反向传播存在问题

在进行深度学习模型训练时，报错:

之前自己也花了大量时间查找原因，大概分析出是因为pytorch版本不符造成的。pytorch1.4版本之前的反向传播过程和1.4版本之后的有些许不同。但配置低版本虚拟环境过程过于繁琐，暂时不考虑该方案。
这是原始代码：

    def process(self, image):
        # process_outputs
        seg_mask, image_rec = self(image)
        """
        G and D process, this package is reusable
        """
        # zero optimizers
        self.optimizer_G.zero_grad()
        self.optimizer_D.zero_grad()
        gen_loss = 0
        dis_loss = 0
        real_B = image
        fake_B = image_rec

        # discriminator loss
        dis_input_real = real_B
        dis_input_fake = fake_B.detach()
        dis_real, dis_real_feat = self.model_D(dis_input_real)
        dis_fake, dis_fake_feat = self.model_D(dis_input_fake)
        dis_real_loss = self.adversarial_loss(dis_real, True, True)
        dis_fake_loss = self.adversarial_loss(dis_fake, False, True)
        dis_loss += (dis_real_loss + dis_fake_loss) / 2

        # generator adversarial loss
        gen_input_fake = fake_B
        gen_fake, gen_fake_feat = self.model_D(gen_input_fake)
        gen_gan_loss = self.adversarial_loss(gen_fake, True, False) * self.args.lamd_gen
        gen_loss += gen_gan_loss
        # generator feature matching loss
        gen_fm_loss = 0
        for i in range(len(dis_real_feat)):
            gen_fm_loss += self.l1_loss(gen_fake_feat[i], dis_real_feat[i].detach())
        gen_fm_loss = gen_fm_loss * self.args.lamd_fm
        gen_loss += gen_fm_loss
        # generator l1 loss
        gen_l1_loss = self.l1_loss(fake_B, real_B) * self.args.lamd_p
        gen_loss += gen_l1_loss

        # Backward and optimize discriminator
        dis_loss.backward()
        self.optimizer_D.step()
        # Backward and optimize generator
        gen_loss.backward()
        self.optimizer_G.step()
        # create logs
        logs = dict(
            gen_gan_loss=gen_gan_loss,
            gen_fm_loss=gen_fm_loss,
            gen_l1_loss=gen_l1_loss,
            # gen_content_loss=gen_content_loss,
            # gen_style_loss=gen_style_loss,
        )
        return seg_mask, fake_B, gen_loss, dis_loss, logs

目前已经实验过的方法有：
1、将dis_loss.backward()调到gen_loss.backward()前面，此方法虽能解决报错，但理论上仍存在错误，模型无法收敛
2、添加retain_graph=True操作，无法解决问题

希望有人能给出代码的完整修改方案。
https://github.com/pytorch/pytorch/issues/39141 此链接是pytorch开发人员针对该问题给出的方案，但本人刚学习神经网络，不懂得如何照着修改，可参考修改。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

13条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
玥轩_521 2023-10-07 22:34
关注
获得0.45元问题酬金

援引通义千问：在进行深度学习模型训练时，如果使用的是pytorch1.4版本之前的反向传播过程，可能会导致报错。解决这个问题的方法是配置低版本的虚拟环境，但这会比较繁琐。目前你已经尝试过的方法包括将dis_loss.backward()调到gen_loss.backward()前面，以及添加retain_graph=True操作，但这些方法都无法解决问题。
建议你可以参考pytorch开发人员给出的方案，修改代码以解决这个问题。如果你不熟悉神经网络，可能需要找一个熟悉神经网络的人帮助你。你也可以在网上查找关于如何修改pytorch代码的相关教程和资料，以帮助你解决问题。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

深度学习的关键技术：反向传播算法
2024-03-24 11:32

AGI通用人工智能之禅的博客在深度学习模型中,反向传播算法是一个关键的技术,它能够高效地更新神经网络的参数,使得模型能够不断优化,最终学习到有效的特征表示。本文将深入探讨反向传播算法的原理和实现细节,并结合实际应用场景,全面介绍这一...
gan+cnn.zip
2020-01-16 22:13

在这个项目中，开发者可能手动实现了反向传播算法来优化网络参数，而不是依赖TensorFlow、PyTorch等高级深度学习库。这虽然增加了编程的复杂性，但也有助于理解模型内部的工作原理。综上所述，这个压缩包可能包含...
道理我都懂，但是神经网络反向传播时的梯度到底怎么求？
2021-08-02 10:05

小白学视觉的博客还举上面这个例子，设,我们要求,那么我们直接就可以写出 L对H的导数，是反向传播当中上一层会告诉你的，但问题是H对W的导数怎么求呢？如果你学会了刚才的维度分析法，那么你可能会觉得是一个DxN的矩阵。然后就会...
【干货小铺】各种编程语言的深度学习库整理
2021-08-12 10:15

小白学视觉的博客训练的方法包括了对比散度的预训练和众所周知的训练算法（如反向传播法或共轭梯度法）的细调。 2. deepnet实现了许多深度学习框架和神经网络算法，包括反向传播(BP)、受限玻尔兹曼机(RBM)、深度信念网络(DBP)、深度...
【AI】从正则化到反向传播——深度学习中的参数优化算法
2023-08-24 12:17

光剑书架上的书的博客随着深度学习技术的不断革新，近几年来，许多领域的模型都采用了高度非凡的结构，如CNN、RNN、GAN等。这些模型的参数优化过程也同样变得十分复杂，为了训练出好的模型，需要对它们的超参数进行优化，而寻找一个合适...
GAN-Base-on-Matlab-master.zip_GAN网络_matlab gan_对抗生成网络_对抗网络_生成对抗
2022-07-14 19:06

4. **训练和评估函数**：实现GAN的训练循环，包括前向传播、反向传播和更新权重。 5. **可视化脚本**：用于展示生成样本和训练过程的进展。 6. **配置文件**：可能包含超参数设置，如学习率、批次大小等。 7. **结果...
深度学习入门：学习神经网络、卷积神经网络以及反向传播算法的基础知识
2023-08-11 02:57

光剑书架上的书的博客人工智能的兴起曾经引起...在这篇文章中，我将会用通俗易懂的语言，带领大家了解一些关于神经网络、卷积神经网络及反向传播算法的基本知识。这些都是我们需要理解和掌握的内容，能够帮助读者加深对深度学习的认识。
GAN（生成对抗网络）的系统全面介绍（醍醐灌顶）
2022-01-18 09:34

打灰人的博客本文是关于GAN学习的较为系统全面的介绍，主要针对初学者，希望能够对大家带来帮助。
基于GAN的MRI图像质量改善
2024-01-17 16:18

训练过程中，会使用损失函数（如对抗损失和循环一致损失）来衡量模型性能，并通过反向传播更新权重。 4. 图像恢复：当GAN模型训练完成后，可以将其应用于新的MRI图像，生成质量提升的图像。这个过程叫做推理，通常...
GAN可解释性理论和实践
2023-08-13 01:01

光剑书架上的书的博客深度学习在图像、文字等领域取得了极大的成功，但对于生成模型（Generative Adversarial Networks, GAN）来说却是一个全新的领域。它由两个相互对抗的网络组成，一个生成网络G将潜藏于训练数据内部的结构和信息转换...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 10月15日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 10月7日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
赞助了问题酬金15元 10月7日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月7日

悬赏问题

¥15 关于#c语言#的问题，请各位专家解答！
¥15 这个如何解决详细步骤
¥15 在微信h5支付申请中，别人给钱就能用我的软件，这个的所属行业是啥？
¥30 靶向捕获探针设计软件包
¥15 别人给钱就能用我的软件，这个的经营场景是啥？
¥15 react-diff-viewer组件，如何解决数据量过大卡顿问题
¥20 遥感植被物候指数空间分布图制作
¥15 安装了xlrd库但是import不了…
¥20 Github上传代码没有contribution和activity记录
¥20 SNETCracker

GAN反向传播存在问题

13条回答 默认 最新

问题事件

悬赏问题

13条回答默认最新