Python基于自建图像数据集运行CGAN模型

代码与报错如下该如何解决，数据集是1368*208尺寸的图片，标签共5类。


import matplotlib
matplotlib.use("TkAgg") # 设置交互式后端

import torch
import torch.nn as nn
import torch.nn.functional as F
from torch.utils.data import DataLoader
import torchvision
from torchvision.datasets import ImageFolder
import torchvision.transforms as transforms

import numpy as np
import matplotlib.pyplot as plt

# 数据预处理
transform = transforms.Compose([
transforms.Resize((1368, 208)),
transforms.ToTensor(),
transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))
])



# 独热编码，将标签转变成张量形式
def one_hot(x, class_count=10):
x = torch.LongTensor(x) # 将x转换为LongTensor类型
return torch.eye(class_count)[x, :]


# 加载数据集
dataset = ImageFolder(root='G:\project\data\dataset', transform=transform)

# 数据加载器
dataloader = DataLoader(dataset, batch_size=10, shuffle=True)


# 生成器的初始化部分
# PS：1.输出层要用Tanh激活函数 2.使用batchnorm，解决初始化差的问题，帮助梯度传播到每一层，防止生成器包所有的样本都收敛到同一个点
class Generator(nn.Module):
def __init__(self):
super(Generator, self).__init__()
self.linear1 = nn.Linear(100, 128 * 43 * 7)
self.bn1 = nn.BatchNorm1d(128 * 7 * 7)
self.linear2 = nn.Linear(10, 128 * 43 * 7)
self.bn2 = nn.BatchNorm1d(128 * 43 * 7)
# 这里是反卷积，stride=2即让图像放大2倍,padding=2即往里缩小两格。
self.decon1 = nn.ConvTranspose2d(in_channels=256, out_channels=128,
kernel_size=(3, 3),
stride=2,
padding=1,
output_padding=1)
self.bn3 = nn.BatchNorm2d(128)
self.decon2 = nn.ConvTranspose2d(128, 64,
kernel_size=(4, 4),
stride=2,
padding=1,
output_padding=1)
self.bn4 = nn.BatchNorm2d(64)
self.decon3 = nn.ConvTranspose2d(64, 3,
kernel_size=(4, 4),
stride=2,
padding=1,
output_padding=1)

def forward(self, x1, x2):
x1 = F.relu(self.linear1(x1))
x1 = self.bn1(x1)
x1 = x1.view(-1, 128, 43, 7)
x2 = F.relu(self.linear2(x2))
x2 = self.bn2(x2)
x2 = x2.view(-1, 128, 43, 7)
x = torch.cat([x1, x2], dim=1)
x = F.relu(self.decon1(x))
x = self.bn3(x)
x = F.relu(self.decon2(x))
x = self.bn4(x)
x = torch.tanh(self.decon3(x))
return x


# 判别器的初始化部分

class Discriminator(nn.Module):
def __init__(self):
super(Discriminator, self).__init__()
self.linear = nn.Linear(10, 128 * 43 * 7).float()
self.conv1 = nn.Conv1 = nn.Conv2d(in_channels=3, out_channels=64, kernel_size=3, stride=2)
self.conv2 = nn.Conv2d(in_channels=64, out_channels=128, kernel_size=3, stride=2)
self.bn = nn.BatchNorm2d(128)
self.fc = nn.Linear(128 * 43 * 7, 1)

def forward(self, x1, x2):
x1 = F.leaky_relu_(self.linear(x1.float()))
x1 = x1.view(-1, 128, 43, 7)
x = torch.cat([x1, x2], dim=1)
x = F.dropout2d(F.leaky_relu_(self.conv1(x))) # nn.LeakyReLU() 更适合作为模型的一部分使用，因为它会返回一个新的张量，而不会修改原始数据
x = F.dropout2d(F.leaky_relu_(self.conv2(x)))
x = self.bn(x)
x = x.view(-1, 128 * 43 * 7)
x = torch.sigmoid(self.fc(x))
return x


# 初始化模型，定义优化器，损失函数
device = 'cuda' if torch.cuda.is_available() else 'cpu'
gen = Generator().to(device)
dis = Discriminator().to(device)
g_optim = torch.optim.Adam(gen.parameters(), lr=0.0001)
d_optim = torch.optim.Adam(dis.parameters(), lr=0.0001) # PS：将判别器的学习率设置小一点可以减小其学习速度，防止一边倒
loss_fun = torch.nn.BCELoss()


# 定义绘图函数

def gen_img_plot(model, label_input, noise_input):
# 将标签转换为独热编码形式
label_onehot = one_hot(label_input, class_count=10).to(device)
# 通过生成器生成图像
gen_img = gen(noise_input, label_onehot)
# 使用判别器评估生成的图像
prediction = np.squeeze(dis(label_onehot, gen_img).cpu().numpy())
# 绘制图像
fig, axes = plt.subplots(nrows=4, ncols=4, figsize=(4, 4))
for i, ax in enumerate(axes.flat):
ax.imshow((prediction[i] + 1) / 2, cmap="gray")
ax.axis("off")
plt.draw() # 强制绘制图形
plt.pause(0.001) # 留出足够的时间显示图像


noise_seed = torch.randn(16, 100, device=device)
label_seed = torch.randint(0, 10, size=(16,))
label_seed_onehot = one_hot(label_seed,class_count=10).to(device)
print(label_seed)

# 训练GAN
G_loss = []
D_loss = []
for epoch in range(10):
g_epoch_loss = 0
d_epoch_loss = 0
count = len(dataloader)
for step, (img, label) in enumerate(dataloader):
img = img.to(device)
label = label.to(device)
size = img.shape[0]
random_seed = torch.randn(size, 100, device=device)
# 优化判别器
d_optim.zero_grad()
# 优化真实图片
real_output = dis(label, img)
real_loss = loss_fun(real_output, torch.ones_like(real_output, device=device))
real_loss.backwar()
gen_img = gen(random_seed, label)
fake_output = dis(label, gen_img.detach())
fake_loss = loss_fun(fake_output, torch.zeros_like(fake_output, device=device))
fake_loss.backward()

d_loss = real_loss + fake_loss
d_optim.step()

# 优化生成器
g_optim.zero_grad()
fake_output = dis(label, gen_img)
g_loss = loss_fun(fake_output, torch.ones_like(fake_output, device=device))
g_loss.backward()
g_optim.step()

with torch.no_grad():
d_epoch_loss += d_loss.item()
g_epoch_loss += g_loss.item()

with torch.no_grad():
d_epoch_loss /= count
g_epoch_loss /= count
D_loss.append(d_epoch_loss)
G_loss.append(g_epoch_loss)
print("Epoch:", epoch)
print(label_seed)
gen_img_plot(gen, label_seed, noise_seed)

plt.plot(D_loss, label="D_loss")
plt.plot(G_loss, label="G_loss")
plt.legend()
plt.show()

报错如下：


Traceback (most recent call last):
  File "G:\project\CGAN1.py", line 151, in <module>
    real_output = dis(label, img)
  File "C:\Users\16043\venv\lib\site-packages\torch\nn\modules\module.py", line 1511, in _wrapped_call_impl
    return self._call_impl(*args, **kwargs)
  File "C:\Users\16043\venv\lib\site-packages\torch\nn\modules\module.py", line 1520, in _call_impl
    return forward_call(*args, **kwargs)
  File "G:\project\CGAN1.py", line 95, in forward
    x = torch.cat([x1, x2], dim=1)
RuntimeError: Sizes of tensors must match except in dimension 1. Expected size 1 but got size 10 for tensor number 1 in the list.

进程已结束,退出代码1

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

24条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
码农阿豪@新空间代码工作室 Java领域优质创作者 2024-03-06 16:23
关注
获得1.00元问题酬金

让阿豪来帮你解答，本回答参考chatgpt3.5编写提供，如果还有疑问可以评论或留言
该代码存在一个缺失的部分，无法判断需要解决的问题是什么。请提供更完整的代码和问题描述。

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

运行CGAN时为什么总是提示我process.py: error: unrecognized arguments: \ \ \ python tensorflow 人工智能深度学习
2019-09-15 22:04

回答 2 已采纳不用加 \ 就可以运行了
GAN训练生成的图像不清晰且无法辨认深度学习生成对抗网络
2022-12-23 14:36

回答 1 已采纳 loss函数弄错了吧
利用keras框架搭建一个简单CGAN模型，制作一个数据集用作训练
2023-05-10 13:09

风吹多了会面瘫的博客如果想通过控制台输入控制图像生成的话，可以将生成器中label封装一层文本相似度比较的程序，通过比较输入文本与数据集中映射文本的相似度选取最高相似度的文本对应的序号作为随机条件噪声输入，只需要把sample_...
pythonAI将马赛克照片还原高清
2022-05-11 02:11

2. 构建模型：生成器和判别器的架构通常基于现有的卷积神经网络（CNN）模型进行设计，如DC-GAN（Deep Convolutional Generative Adversarial Networks）或CGAN（Conditional GAN）等，以处理图像数据。 3. 训练过程...
动漫人物头像生成实现Python代码.zip
2022-05-25 13:24

标题 "动漫人物头像生成实现Python代码.zip" 暗示了这个压缩包包含了一组使用Python编程语言实现的代码，用于生成动漫风格的人物头像。这种技术通常涉及到深度学习和计算机图形学，特别是条件生成对抗网络...
【pytorch】CGAN编程实现
2022-10-25 22:25

学渣渣渣渣渣的博客由于原始GAN生成的图像是随机的，不可预测的，无法控制网络输出特定的图片，，可控性不强。针对原始GAN不能生成具有特定属性的图片的问题， Mehdi ...实际上 , 在无条件约束的生成模型中 , 没法控制数据生成的模式。
Python-各种对抗神经网络GAN大合集
2019-08-11 06:33

本资源"Python-各种对抗神经网络GAN大合集"提供了一个全面的GAN实现合集，适合对深度学习和Python编程感兴趣的开发者进行学习和研究。 GANs的核心概念是由两个神经网络组成：生成器（Generator）和判别器...
Python-使用条件对抗网格的实现图像到图像的转换
2019-08-10 04:52

在Python编程领域，图像处理是一项重要的任务，而条件对抗网络(Conditional Adversarial Networks, 简称CGAN)在图像到图像转换中扮演着关键角色。本篇将深入探讨如何利用CGAN实现图像的变换，并结合提供的"pix2pix-...
Python-GAN实战对抗生成网络深度学习随书代码
2019-08-11 06:04

3. **数据集**：可能包含用于训练和测试模型的数据集，这些数据集可能来自各种领域，如图像、音频或文本。 4. **环境配置**：可能有一个requirements.txt文件，列出了运行代码所需的Python库及其版本。 5. **Jupyter...
Python-利用GAN进行图片填充
2019-08-11 05:52

总的来说，Python利用GAN进行图片填充是一个涉及深度学习、图像处理和编程实践的综合任务。通过理解GAN的工作原理，掌握Python深度学习库的使用，以及对图像数据的处理，我们可以实现高效且高质量的图片填充算法。...
使用Pix2pix架构去除图像中的划痕_Jupyter Notebook_Python_下载.zip
2023-04-28 13:42

首先，我们需要准备数据集，这些数据集应包含有划痕的旧图像和对应的修复后图像。然后，我们将对数据进行预处理，如调整大小、归一化等，以便适应模型输入的要求。接下来，我们将构建Pix2pix的网络结构。生成器...
Python-多种GAN算法的Chainer实现
2019-08-11 02:13

2. **数据集**：为了训练和测试模型，可能会包含一些常用的数据集，如MNIST、CIFAR-10或者 CelebA。 3. **配置文件**：可能有JSON或YAML文件来设置训练参数，如学习率、批次大小、迭代次数等。 4. **README**：文档...
遮罩GAN-图像属性遮罩生成
2022-05-19 16:41

10. **images**：这个目录可能包含了训练模型所需的图像数据集，或者可能是训练过程中的输出结果，如生成的图像或遮罩。理解并实现这样的项目需要深入的深度学习和计算机视觉知识，同时也需要熟悉Python编程和常用...
如何解决工业缺陷检测小样本问题？
2022-03-02 07:00

3Ｄ视觉工坊的博客作者丨吴雨培来源丨act 工业AI编辑丨极市平台当前基于有监督的缺陷检测算法，在数据量充足的场景下已经逐步成功落地，但工业场景具有一定的离散性，大部分应用场景均为小样本检测场景，小样本问题...
CV：计算机视觉技最强学习路线之CV简介(传统视觉技术/相关概念)、早期/中期/近期应用领域(偏具体应用)、经典CNN架构(偏具体算法)概述、常用工具/库/框架/产品、环境安装、常用数据集、编程技巧
2022-10-18 01:51

一个处女座的程序猿的博客 CV：计算机视觉技最强学习路线之CV简介(传统视觉技术/相关概念)、早期/中期/近期应用领域(偏具体应用)、经典CNN架构(偏具体算法)概述、常用工具/库/框架/产品、环境安装、常用数据集、编程技巧目录最新文章 ...
生成对抗网络(GAN)生成MNIST数据
2021-07-21 14:10

Forever__ _的博客 GAN是一种基于博弈论的生成式网络，它是2014年有 Ian Goodfellow提出，主要解决的是如何从训练样本中学习出新的样本。其中GAN既不依赖标签来优化，也不是根据奖惩来调整参数，它是根据生成器和判别器之间的博弈来...
PyTorch深度学习实战（1）——神经网络与模型训练过程详解
2023-05-28 08:06

盼小辉丶的博客在本节中，我们将使用一个简单的数据集创建一个简单的神经网络架构，以了解 ANN 的各个组成部分(前向传播、反向传播、学习率等)对于模型权重调整的作用，以掌握神经网络如何根据给定输入学习预测输出。我们将首先...
GAN侧脸照片生成正脸（可直接训练）源代码.zip
2021-08-04 22:38

在这个特定的项目中，生成器会尝试创建逼真的正脸图像，而判别器则试图区分这些图像是否来自真实数据集还是生成器的产物。描述中提到的“可直接训练”意味着这个源代码包包含了完整的训练流程，用户可以直接运行...
用 Python 可以实现侧脸转正脸？我也要试一下！
2020-07-25 14:07

Python新世界的博客作者 | 李秋键责编 | Carol 封图 | CSDN 下载自视觉中国很多人学习python，不知道...近几年来GAN图像生成应用越来越广泛，其中主要得益于GAN 在博弈下不断提高建模能力，最终实现以假乱真的图像生成。GAN 由两...
python开源人工智能项目_开源 | 深度有趣 - 人工智能实战项目合集
2020-12-10 10:04

weixin_39593061的博客但又不仅仅是实战，因为对项目所涉及的原理和模型也会加以讨论和深入。我把这门课命名为《深度有趣》，因为有趣才乐于钻研，因为钻研才深度有趣。课程特点《深度有趣》使用Python3、TensorFlow1.9和Keras2.2...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 3月13日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 3月5日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月5日

悬赏问题

¥15 grbl的G92修改MPos的问题。
¥15 vue2中，Ant Design Pro s-table中，使用服务端排序怎么做
¥15 阿里巴巴国际站的商品详细页如何做到图文分离
¥15 根据质因子个数求因式个数
¥15 matlab模糊控制隶属函数设计
¥15 DB2的REPLACE函数报错求解
¥45 C++上传文件到SFTP
¥20 组态王海康Vision Master
¥15 思科WS-C4503-E核心交机
¥15 批量提取WORD信息到EXCEL

Python基于自建图像数据集运行CGAN模型

24条回答 默认 最新

问题事件

悬赏问题

24条回答默认最新