AI绘画Stable diffusion 提示词问题

AI绘画Stable diffusion 在生成Q版表情包的时候，设置了full body，也增加了权重，但是怎么都没法抽出完整身体

stable diffusion

增加权重、设置视角、增大尺寸

生成的Q版人物能有完整的身体，而不是大头照

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

码农阿豪@新空间代码工作室 Java领域优质创作者 2024-03-27 11:44

关注

让阿豪来帮你解答，本回答参考chatgpt3.5编写提供，如果还有疑问可以评论或留言

这种情况可能是因为稳定扩散算法在生成Q版表情包时无法保证完整身体的图案连贯性。增加权重、设置视角、增大尺寸等尝试已经用了，但是效果不佳。解决方案可以考虑采用其他生成算法来生成完整身体的图案，例如PixelGAN、StyleGAN等，这些算法在图像生成中效果较好，并且具有更好的图案连贯性和真实性。同时，还可以考虑对生成器和判别器的网络结构进行优化，以提高生成效果。代码示例如下（使用PixelGAN算法生成完整身体的Q版表情包）：

# 导入需要的库和模块
import torch
import torch.nn as nn
from torchvision import transforms
from models.pixel_gan import PixelGAN
# 定义像素化GAN算法
class PixelGAN(nn.Module):
    def __init__(self, input_dim=3, output_dim=3, num_filters=64):
        super(PixelGAN, self).__init__()
        self.generator = nn.Sequential(
            nn.ConvTranspose2d(input_dim, num_filters * 8, kernel_size=4, stride=1),
            nn.BatchNorm2d(num_filters * 8),
            nn.ReLU(True),
            nn.ConvTranspose2d(num_filters * 8, num_filters * 4, kernel_size=4, stride=2, padding=1),
            nn.BatchNorm2d(num_filters * 4),
            nn.ReLU(True),
            nn.ConvTranspose2d(num_filters * 4, num_filters * 2, kernel_size=4, stride=2, padding=1),
            nn.BatchNorm2d(num_filters * 2),
            nn.ReLU(True),
            nn.ConvTranspose2d(num_filters * 2, num_filters, kernel_size=4, stride=2, padding=1),
            nn.BatchNorm2d(num_filters),
            nn.ReLU(True),
            nn.ConvTranspose2d(num_filters, output_dim, kernel_size=4, stride=2, padding=1),
            nn.Tanh()
        )
        self.discriminator = nn.Sequential(
            nn.Conv2d(input_dim, num_filters, kernel_size=4, stride=2, padding=1),
            nn.LeakyReLU(0.2, inplace=True),
            nn.Conv2d(num_filters, num_filters * 2, kernel_size=4, stride=2, padding=1),
            nn.BatchNorm2d(num_filters * 2),
            nn.LeakyReLU(0.2, inplace=True),
            nn.Conv2d(num_filters * 2, num_filters * 4, kernel_size=4, stride=2, padding=1),
            nn.BatchNorm2d(num_filters * 4),
            nn.LeakyReLU(0.2, inplace=True),
            nn.Conv2d(num_filters * 4, num_filters * 8, kernel_size=4, stride=2, padding=1),
            nn.BatchNorm2d(num_filters * 8),
            nn.LeakyReLU(0.2, inplace=True),
            nn.Conv2d(num_filters * 8, 1, kernel_size=4, stride=1),
            nn.Sigmoid()
        )
    def forward(self, x):
        out = self.discriminator(x)
        out = out.view(out.size(0), -1)
        return out
# 定义训练函数
def train(data_loader, model, loss_fn, optimizer, num_epochs=10):
    for epoch in range(num_epochs):
        for batch_idx, data in enumerate(data_loader):
            inputs, _ = data
            real_labels = torch.ones(inputs.size(0))
            fake_labels = torch.zeros(inputs.size(0))
            # 训练判别器
            optimizer.zero_grad()
            outputs = model(inputs)
            real_loss = loss_fn(outputs, real_labels)
            real_loss.backward()
            # 生成Fake图像
            noise = torch.randn(inputs.size(0), 3, 64, 64)
            fake = model.generator(noise)
            outputs = model(fake.detach())
            fake_loss = loss_fn(outputs, fake_labels)
            fake_loss.backward()
            optimizer.step()
            # 训练生成器
            optimizer.zero_grad()
            outputs = model(fake)
            loss = loss_fn(outputs, real_labels)
            loss.backward()
            optimizer.step()
            if batch_idx % 100 == 0:
                print("Epoch [%d/%d], Batch [%d/%d], Loss: %.4f"
                      % (epoch + 1, num_epochs, batch_idx, len(data_loader), loss.item()))
# 加载数据
transform = transforms.Compose([transforms.Resize(64),
                                transforms.CenterCrop(64),
                                transforms.ToTensor(),
                                transforms.Normalize(mean=[0.5, 0.5, 0.5], std=[0.5, 0.5, 0.5])])
data_loader = torch.utils.data.DataLoader(dataset, batch_size=64, shuffle=True)
# 初始化模型、损失函数和优化器
gan = PixelGAN()
criterion = nn.BCELoss()
optimizer = torch.optim.Adam(gan.parameters(), lr=0.0002, betas=(0.5, 0.999))
# 训练模型
train(data_loader, gan, criterion, optimizer, num_epochs=10)
# 生成图像
noise = torch.randn(1, 3, 64, 64)
fake = gan.generator(noise).detach().numpy()

报告相同问题？

关注问题

stable diffusion运行出错人工智能图像处理
2022-10-10 11:56

回答 2 已采纳你的环境变量设置的有问题，是不设置GIT这个值了？
Stable Diffusion 本地化部署更新问题 git github python
2023-03-22 22:17

回答 2 已采纳琢磨完，已经通过手动安装解决了，没留截图，容我思考下如何写
stable diffusion怎样并行生成图片 python 图像处理
2023-01-09 00:43

回答 2 已采纳官方并没有提到任何并行的信息 https://github.com/A
AI绘画Stable Diffusion提示词神器来了！一键中英切换，AI帮你写提示词！
2024-04-18 12:07

画画的小强的博客感兴趣的小伙伴，赠送全套AIGC学习资料，包含AI绘画、AI人工智能等前沿科技教程和软件工具，具体看这里。AIGC技术的未来发展前景广阔，随着人工智能技术的不断发展，AIGC技术也将不断提高。未来，AIGC技术将在游戏和...
stable diffusion内存溢出 python 计算机视觉
2023-02-18 10:54

回答 2 已采纳请看👉 ：Stable diffusion安装经历踩坑除此之外, 这篇博客: Stable diffusion安装经历踩坑中的问题部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中
torch问题-（stable diffusion2.0） linux python pytorch
2023-01-13 10:10

回答 1 已采纳输入 nvcc -V看下，你截图的这个的cuda根本不是你安装的cuda，而是你目前的驱动支持到cuda11.4。总共有三个东西，一个是显卡驱动，这个会显示你目前显卡的驱动可以支持到最高的cuda版本
除了huggingface，还有其他靠谱的国内 Stable Diffusion API 推荐吗？速度快，质量好，又便宜的那种？人工智能
2023-03-01 20:49

回答 2 已采纳目前没有国内其他靠谱的Stable Diffusion API可推荐，如果您想要一个快速、高质量又便宜的Stable Diffusion API，建议您使用huggingface。回答不易，记得采纳呀
AI绘画Stable Diffusion提示词工具推荐
2024-04-22 15:55

画画的小强的博客感兴趣的小伙伴，赠送全套AIGC学习资料，包含AI绘画、AI人工智能等前沿科技教程和软件工具，具体看这里。AIGC技术的未来发展前景广阔，随着人工智能技术的不断发展，AIGC技术也将不断提高。未来，AIGC技术将在游戏和...
kaggle云端部署的stable diffusion运行时Lora模块没法儿用 python
2023-03-27 12:09

回答 2 已采纳看起来是lora.py文件中的lora_apply_weights函数出了问题，函数中使用了“|”操作符，但是“|”操作符不支持type类型，所以报错了。可以尝试把“|”操作符改成“or”，看看是否可
python stable-diffusion ldm print python
2022-08-30 03:25

回答 1 已采纳 pip安装模块会出现不兼容的情况，因为并不是所有的第三方模块都支持python3.可以使用python自带的2to3工具在Python2到3之间转换，这个工具位于：详见https://blog.csd
basicsr库的安装使用问题 python pytorch 人工智能
2023-04-14 11:49

回答 2 已采纳从第一个导入报错可以看到这里导入的basicsr是D:\stable-diffusion-webui\repositories\CodeFormer\basicsr本地测试可通过pip安装basics
Ai绘画工具，Stable Diffusion提示词使用指南
2024-04-24 09:32

爱绘画的彤姐的博客 AIGC技术的未来发展前景广阔，随着人工智能技术的不断发展，AIGC技术也将不断提高。...感兴趣的小伙伴，赠送全套AIGC学习资料和安装工具，包含AI绘画、AI人工智能等前沿科技教程，模型插件，具体看下方。
disco diffusion的step该设置多少 python 人工智能
2022-12-26 19:28

回答 1 已采纳望采纳 Disco diffusion本来速度就要慢一些（但我看3080一般5-20分钟也够了，你一个多小时确实时间有点长啊），你把step设置为100试试。另外，你也可以看看stable diffu
AI绘画Stable Diffusion提示词教程：多人情景喜剧场景
2024-04-10 10:12

程序员晓晓的博客感兴趣的小伙伴，赠送全套AIGC学习资料，包含AI绘画、AI人工智能等前沿科技教程和软件工具，具体看这里。AIGC技术的未来发展前景广阔，随着人工智能技术的不断发展，AIGC技术也将不断提高。未来，AIGC技术将在游戏和...
免费AI绘画 Stable Diffusion | “动漫图像”生成提示词分享及实践教程
2024-04-22 17:09

灵魂画师向阳的博客感兴趣的小伙伴，赠送全套AIGC学习资料，包含AI绘画、AI人工智能等前沿科技教程和软件工具，具体看这里。AIGC技术的未来发展前景广阔，随着人工智能技术的不断发展，AIGC技术也将不断提高。未来，AIGC技术将在游戏和...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月27日

悬赏问题

¥15 部分客户订单定位有误的问题
¥15 如何在maya程序中利用python编写领子和褶裥的模型的方法
¥15 Linux权限管理相关操作（求解答）
¥15 Bug traq 数据包大概什么价
¥15 在anaconda上pytorch和paddle paddle下载报错
¥25 自动填写QQ腾讯文档收集表
¥15 DbVisualizer Pro 12.0.7 sql commander光标错位显示位置与实际不符
¥15 android 打包报错
¥15 关于stm32的问题
¥15 ncode振动疲劳分析中，noisefloor如何影响PSD函数？