ConditionGAN的学习率一般设置多少比较合适

我正在写一个ConditionGAN，但是学习率调整了很久生成器和判别器的loss一直不平衡，请问应该如何设置学习率比较合适？
我的代码如下：

criterion = nn.MSELoss()
G_optimizer = Adam(generator.parameters(), lr=5e-4, betas=(0.5, 0.999))
D_optimizer = Adam(discriminator.parameters(), lr=1e-5, betas=(0.5, 0.999))
G_scheduler = lr_scheduler.CosineAnnealingLR(G_optimizer, T_max=num_epochs)   
D_scheduler = lr_scheduler.CosineAnnealingLR(D_optimizer, T_max=num_epochs) 


G_train_losses = []
D_train_losses = []
lambda_gp = 10
num_G = 1

#训练
for epoch in range(num_epochs):
    G_losses = 0
    D_losses = 0

    for i, (images, audios) in enumerate(data_loader):

        images = images.to(device)
        audios = audios.to(device)
        #生成图像情感标签
        with torch.no_grad():
            image_emotion = emotion_classification(images)
            image_emotion = torch.argmax(image_emotion, dim=1)
        noise = torch.randn(audios.shape[0], 100).to(device)

        
        #判别器训练
        D_optimizer.zero_grad()

        #真实图像
        real_validity = discriminator(audios, image_emotion)
        real_loss = criterion(real_validity, torch.ones_like(real_validity).to(device))

        #假图像
        z = torch.randn(audios.shape[0], 100).to(device)
        fake_labels = torch.randint(0, 7, (audios.shape[0],)).to(device)
        fake_images = generator(z, fake_labels)
        fake_validity = discriminator(fake_images, fake_labels)
        fake_loss = criterion(fake_validity, torch.zeros_like(fake_validity).to(device))

        #梯度惩罚
        gp = gradient_penalty(discriminator, audios, fake_images, image_emotion)

        #总损失
        D_loss = real_loss + fake_loss + lambda_gp * gp
        D_losses += D_loss.item()
        D_loss.backward()
        D_optimizer.step()

        for j in range(num_G):
            #生成器训练
            generator.train()
            G_optimizer.zero_grad()

            #生成假图像
            z = torch.randn(audios.shape[0], 100).to(device)
            fake_labels = torch.randint(0, 7, (audios.shape[0],)).to(device)
            fake_images = generator(z, fake_labels)

            #判别器判断
            validity = discriminator(fake_images, fake_labels)
            G_loss = criterion(validity, torch.ones_like(validity).to(device))
            G_losses += G_loss.item()
            G_loss.backward()
            G_optimizer.step()


        #打印进度条
        total_batches = len(data_loader)
        progress = (i + 1) / total_batches * 100
        bar_length = 30
        filled_length = int(bar_length * (i + 1) // total_batches)
        bar = '=' * filled_length + '-' * (bar_length - filled_length)
        print(f'\rEpoch {epoch+1}/{num_epochs}       Training: {progress:3.0f}%|{bar}| {i+1}/{len(data_loader)}', end='  ', flush=True)


    G_train_losses.append(G_losses / (num_G*len(data_loader)))
    D_train_losses.append(D_losses / len(data_loader))
    print(f"[epoch={epoch + 1:3d}]  generator loss: {G_train_losses[epoch]:.4f}  discriminator loss: {D_train_losses[epoch]:.4f}")

    generator.eval()
    z = torch.randn(7, 100).to(device)
    labels = torch.tensor([0, 1, 2, 3, 4, 5, 6]).to(device)
    sample_audio = generator(z, labels).squeeze().data.cpu()

    #绘制生成的音频
    plt.figure(figsize=(20, 16))
    for i in range(7):
        audio = sample_audio[i]
        audio = (audio + 1) / 2 * (global_max - global_min) + global_min
        audio = audio.expm1()
        spec_db = T.AmplitudeToDB()(audio)
        spec_db = spec_db.squeeze(0)
        plt.subplot(1, 8, i+1)
        plt.imshow(spec_db)
    plt.tight_layout()
    plt.show()

    G_scheduler.step()
    D_scheduler.step()

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

阿里嘎多学长 2025-04-20 00:08

关注

阿里嘎多学长整理AIGC生成，因移动端显示问题导致当前答案未能完全显示，请使用PC端查看更加详细的解答过程

ConditionGAN学习率设置

ConditionGAN是一个生成对抗网络（GAN），学习率的设置对模型的收敛和loss的平衡非常重要。一般来说，学习率太高可能会导致模型的loss不稳定，太低可能会导致模型的收敛速度太慢。

在你的情况下，你可以尝试以下几种方法来调整学习率：

使用 Cyclical Learning Rate（CLR）：CLR是一种学习率调整策略，它可以帮助模型在不同的学习率下训练，从而避免了学习率太高或太低的问题。

import torch.optim as optim

criterion = nn.MSELoss()
G_optimizer = optim.Adam(G.parameters(), lr=0.001)
D_optimizer = optim.Adam(D.parameters(), lr=0.001)

for epoch in range(num_epochs):
    for i, batch in enumerate(train_loader):
        # ...
        G_optimizer.zero_grad()
        D_optimizer.zero_grad()
        # ...
        G_optimizer.step()
        D_optimizer.step()

使用 Learning Rate Scheduler：Learning Rate Scheduler是一种策略，它可以根据模型的loss和学习率来调整学习率。

import torch.optim as optim

criterion = nn.MSELoss()
G_optimizer = optim.Adam(G.parameters(), lr=0.001)
D_optimizer = optim.Adam(D.parameters(), lr=0.001)

scheduler = optim.lr_scheduler.StepLR(G_optimizer, step_size=5, gamma=0.5)
scheduler = optim.lr_scheduler.StepLR(D_optimizer, step_size=5, gamma=0.5)

for epoch in range(num_epochs):
    for i, batch in enumerate(train_loader):
        # ...
        G_optimizer.zero_grad()
        D_optimizer.zero_grad()
        # ...
        G_optimizer.step()
        D_optimizer.step()
    scheduler.step()

使用 Grid Search：Grid Search是一种简单的方法，可以尝试不同的学习率组合来找到最合适的学习率。

import torch.optim as optim

criterion = nn.MSELoss()
G_optimizer = optim.Adam(G.parameters(), lr=0.001)
D_optimizer = optim.Adam(D.parameters(), lr=0.001)

lr_values = [0.001, 0.005, 0.01]
for lr in lr_values:
    G_optimizer = optim.Adam(G.parameters(), lr=lr)
    D_optimizer = optim.Adam(D.parameters(), lr=lr)
    for epoch in range(num_epochs):
        for i, batch in enumerate(train_loader):
            # ...
            G_optimizer.zero_grad()
            D_optimizer.zero_grad()
            # ...
            G_optimizer.step()
            D_optimizer.step()
    # 评估模型的loss和性能
    # ...

这些方法可以帮助你找到合适的学习率，但是需要注意的是，每个模型的学习率设置都需要根据实际情况进行调整。

报告相同问题？

关注问题

ConditionGAN的学习率一般设置多少比较合适？
2025-04-30 19:30

bug菌¹的博客原问题描述我正在写一个ConditionGAN，但是学习率调整了很久生成器和判别器的loss一直不平衡，请问应该如何设置学习率比较合适？我的代码如下： criterion = nn.MSELoss() G_optimizer = Adam(generator....
GAN学习笔记（1）：GAN综述
2017-12-22 20:25

scarletouyang的博客 GAN学习笔记（1）：GAN综述，针对GAN的基本模型，数学原理，衍生模型，应用领域等，根据大量论文、知乎、CSDN博客网络资料整理
生成对抗网络GAN论文总结+复现代码(已完成29篇)
2022-01-06 13:21

iiiiiiimp的博客 GAN论文总结
AI人工智能领域分类的知识体系
2025-05-26 13:24

AI智能架构工坊的博客本文的目的是对AI人工智能领域进行系统的分类，构建一个清晰的知识体系，帮助读者全面了解人工智能的各个方面，明确不同子领域之间的联系和区别，为进一步的学习和研究提供指导。本文的范围将涵盖人工智能的主要子...
AI人工智能神经网络加速器在游戏开发中的应用创新
2025-07-04 19:41

AGI大模型与大数据研究院的博客本文深入探讨了AI神经网络加速器如何从根本上革新游戏开发流程，从智能NPC行为、实时渲染优化到动态内容生成，全面解析其技术原理、实际应用案例和未来发展趋势。通过具体代码示例和生动比喻，我们将展示神经网络...
AI人工智能时代DALL·E 2的创新之路
2025-06-18 23:42

AI应用开发实战派的博客在当今AI人工智能飞速发展的时代，图像生成技术取得了显著的进步。DALL·E 2作为一款具有代表性的图像生成模型，其创新之处备受关注。本文的目的在于全面剖析DALL·E 2的创新之路，涵盖其技术原理、应用场景、发展...
人工智能：行列式数学基础到综合实战！！
2025-02-19 21:29

AI Agent首席体验官的博客解题关键点观察行列式的对称性巧用初等变换简化计算选择合适的展开方式计算技巧利用行的加减转化为更简单的形式创造零元素简化计算注意符号的处理方法推广这种处理方法适用于类似结构的高阶行列式可以推广到其他具有...
Pytorch使用MNIST数据集实现基础GAN和DCGAN详解
2020-09-18 03:33

在当前的IT领域，深度学习应用已经广泛深入至各种场景，其中生成对抗网络（GAN）和深度卷积生成对抗网络（DCGAN）是推动人工智能发展的关键技术之一。下面我将详细介绍使用Pytorch框架和MNIST数据集来实现基础的GAN...
求解微分方程的人工智能与深度学习方法：现状及展望
2023-12-10 22:32

罗思付之技术屋的博客由于其强大的学习和函数近似能力，深度学习在很多应用领域，如图像处理和机器翻译等，取得了显著的成功。含多个隐藏层的多层前馈神经网络是可描述多种深度学习的网络结构，式（4）表示的3层前馈神经网络就是一种简单...
[GAN学习] 生成动漫人物头像
2023-09-20 17:19

procoder338的博客生成式AI以及比较新的概念AIGC最近比较火,之前的Diffusion model也很火,但是一般的电脑不太好训练,这里使用了GAN模型生成动漫人物他头像,简单易懂。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月20日

ConditionGAN的学习率一般设置多少比较合适

4条回答 默认 最新

问题事件

4条回答默认最新