Help！Gan模型训练的问题！

救命，我已经在这儿卡了半个月了。

最近在跑一个Gan模型，但是怎么都训练不出来，真的好头疼。
——

1、单独测试生成器，只使用MSE_Loss，可以生成图像，只是不太清晰，就像这样：(上面是groundtruth，下面是生成的)

2、单独测试判别器，用vanilla loss的softplus变形，测试噪音和真实图像的判别结果，由Sigmoid输出：

——

结果都挺好的，生成器可以准确生成图像，判别器可以准确判别d_lr结果，但是对抗训练就会出问题！
1、在lr 和 d_lr学习率都为0.0001的条件下，生成的图像和判别器输出如下：

可以看到，判别器对真实图像的分数维持在0.55左右，生成图像的分数维持在0.44左右，d_loss和g_loss小范围波动
2、我怀疑是不是两个分数差的不多，导致生成器没办法获得有用的信息，所以采用更新一次生成器，后面更新两次判别器的方法，结果如下：

这时候，真假样本相差的分数确实更大了，但是继续训练，就会出现：

直接两个都判为真，这是什么问题？

——
我的问题是，我的训练过程有没有什么问题？以及为什么多更新一次判别器会出现都判为真的情况？
大家有没有什么意见，还望不吝赐教！

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2023-08-26 08:41
关注
【以下回答由 GPT 生成】

在训练GAN模型时，遇到困难是常见的。根据你提供的信息，以下是可能导致问题的原因和解决方案：

生成器生成的图像清晰度不高：
可尝试使用像素级别的loss函数，如L1 loss或L2 loss，而不仅仅使用MSE loss。这些loss函数可以更好地捕捉到图像的细节。
可以尝试增加生成器的网络层数，以增加模型的复杂性和表示能力。

可以尝试调整生成器的学习率，以更好地优化生成器的性能。

判别器将两个样本都判为真：

多次更新判别器可能导致判别器过度拟合训练数据。可以尝试减少判别器的更新次数，以平衡生成器和判别器的训练过程。
可以尝试使用不同的判别器loss函数，如Wasserstein loss，来更好地训练判别器。这种loss函数可以更好地解决梯度消失和模式崩溃等问题。
可以尝试增加判别器的网络层数，以增加模型的复杂性和表示能力。

此外，还有一些其他可能的解决方案可以尝试：

可以使用更大的训练数据集，以提高模型的泛化能力。
可以尝试使用不同的优化算法和学习率调度方法，以更好地优化模型。
可以尝试使用正则化技术，如批归一化、dropout等，来减少模型的过拟合。

最后，GAN模型的训练也是一个非常复杂的过程，很难找到一个通用的解决方案，因此建议根据具体情况进行不同的尝试和实验，以找到最佳的训练策略。

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^
解决
无用 1
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

前缀和问题，HELP！ c++ 有问必答
2022-05-15 10:26

回答 2 已采纳 #include<bits/stdc++.h> using namespace std; void shuru(int ,int *); void shuchu(int ,int *,
Help！！困扰了我三天的session问题 java maven spring
2022-08-11 19:18

回答 2 已采纳你只是map参数缺少一个@RequestBody注解修饰而已
HELP！求码！help！ c++ 有问必答
2022-05-15 15:27

回答 3 已采纳你题目的解答代码如下： #include <iostream> using namespace std; void f1(char s[100][100], int m, int n)
CycleGAN训练教程
2024-03-26 20:24

小舞O_o的博客在输入图像和输出图像之间，使用对齐图像对的训练集。但是，对于许多任务，配对训练数据将不可用。我们提出一个学习从源翻译图像的方法域 X 到目标域 Y，在没有配对的情况下例子。我们的目标是学习映射 G ： X → Y...
help!help! python 有问必答
2021-08-31 23:14

回答 2 已采纳换镜像源。清华的镜像，阿里的镜像。
help!!!!!!!!! c++
2021-07-05 18:55

回答 3 已采纳用循环语句实现，写4重循环嵌套，分别用a,b,c,d 当做循环变量，用if语句判断表达式，符合条件就打印。
关于#python#的问题，请各位help help！ python
2021-08-10 14:44

回答 3 已采纳它这个网站图片下载是需要登录的呀。检查该请求的status_code： photo = requests.get(url=photo_url, headers=head).status_code 不
干货！半监督预训练对话模型 SPACE
2022-07-04 18:30

AITIME论道的博客达摩院对话智能团队提出了一种基于半监督预训练的新训练范式，通过半监督方法将少量有标对话数据和海量无标对话数据一起进行预训练，利用一致性正则化损失函数将标注数据中蕴含的对话策略知识注入到预训练模型中去，...
helphelp!!git配置时报这个错为什么 git
2023-03-13 15:47

回答 2 已采纳添加一个 section，你的键没有写对。
一个的报错help！！！ c++ 有问必答
2021-07-31 16:33

回答 1 已采纳 child,cookie没有初始化就进行比较运算了比较2个变量类型不一致，一个是int，一个是size_t，也就是unsigned long longchild,cookie的类型也改成size_t
python程序设计qwq help！！ python
2021-12-26 22:34

回答 2 已采纳嘿兄弟，又见面了 listA=["a","b","c","d"] def daoxu(list1): return list1[::-1] print(daoxu(listA)) 这里你得注
(13-2-02)斗转星移换图系统（PyTorch+Visdom+CycleGAN）：生成对抗网络（GAN）模型+训练CycleGAN模型
2024-04-22 16:35

码农三叔的博客首先，将判别器的梯度清零，然后计算判别器A和判别...，功能是使用PyTorch的生成一个对抗网络（GAN）模型，包括生成器（Generator）和判别器（Discriminator），以及用于构建生成器和判别器的残差块（ResidualBlock）。
C++，，help！！ c++
2021-08-10 19:59

回答 1 已采纳构造函数。用来初始化对象
GAN相关模型理论以及Pytorch实现
2020-05-31 22:02

肥宅_Sean的博客 GAN相关模型理论分析以及Pytorch实现因为是从论文的内容上出发，从最粗糙慢慢走向成熟。在这样的一个过程当中学习GAN相关的内容，以及其他的深度学习的内容。体会论文作者的改进思路，提出创新的出发点，已经用到的...
AI人工智能大模型中——数据集就是一切 The dataset is everything
2024-04-25 03:17

AI天才研究院的博客我认为对计算乘数的搜索比任何不严格...更重要的是，认识到像 GPT-4 或 DALL-E 3 这样的巨大模型仍然存在根本性缺陷，这表明试图从 Llama 2 或 Stable Diffusion 等相对较小的模型中获得真正智能的行为是没有希望的。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 8月28日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
赞助了问题酬金15元 8月26日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月25日

悬赏问题

¥15 vue使用gojs，需求在link中的虚线上添加方向箭头
¥15 CSS通配符清除内外边距为什么可以覆盖默认样式？
¥15 SPSS分类模型实训题步骤
¥15 求解决扩散模型代码问题
¥15 工创大赛太阳能电动车项目零基础要学什么
¥20 limma多组间分析最终p值只有一个
¥15 nopCommerce开发问题
¥15 torch.multiprocessing.spawn.ProcessExitedException: process 1 terminated with signal SIGKILL
¥15 QuartusⅡ15.0编译项目后，output_files中的.jdi、.sld、.sof不更新怎么解决
¥15 pycharm输出和导师的一样，但是标红

Help！Gan模型训练的问题！

3条回答 默认 最新

问题事件

悬赏问题

3条回答默认最新