训练好的beta-VAE模型（效果很好）对于单张图片无法利用模型（权重）进行图片复原，如何解决？

模型已经训练好了，输入一个batch的数据能够利用模型的权重复原图片，如图所示：

但是如果采用单个图片，用模型编码到z值再解码效果很差。如图所示：

单个图片复原（未成功）使用的代码为：

#加载模型
 with open('configs/bbvae_raven.yaml', 'r') as file:
    config = yaml.safe_load(file)
#data = VAEDataset(**config["data_params"], pin_memory=len(config['trainer_params']['gpus']) != 0)
model = vae_models[config['model_params']['name']](**config['model_params'])
state_dict=torch.load('logs/BetaVAE/version_46/checkpoints/epoch=149-step=60599.ckpt')
state_dict=state_dict['state_dict']
from collections import OrderedDict
new_state_dict=OrderedDict()
for k,v in state_dict.items():
    name=k[6:]
    new_state_dict[name]=v
model.load_state_dict(new_state_dict)

#利用模型将图片encode到z值
from torchvision import transforms
def forward_to_z(input: Tensor, **kwargs) -> Tensor:
    mu, log_var = model.encode(input)
    z = model.reparameterize(mu, log_var)
 
    #print(self.decode(z).size())
    return  z

img_tensor=transforms.functional.to_tensor(img)  #将图片输入tensor
z=forward_to_z(img_tensor.reshape(1,1,80,80))#利用模型权重获取z值

#利用z值复原图片
recons=model.decode(z)
pic=recons.detach().numpy()[0,0,:,:]

一个batch的图片复原（成功）使用的代码为：

#加载模型
with open('configs/bbvae_raven.yaml', 'r') as file:
    config = yaml.safe_load(file)
#data = VAEDataset(**config["data_params"], pin_memory=len(config['trainer_params']['gpus']) != 0)
model = vae_models[config['model_params']['name']](**config['model_params'])
state_dict=torch.load('logs/BetaVAE/version_46/checkpoints/epoch=149-step=60599.ckpt')
state_dict=state_dict['state_dict']
from collections import OrderedDict
new_state_dict=OrderedDict()
for k,v in state_dict.items():
    name=k[6:]
    new_state_dict[name]=v
model.load_state_dict(new_state_dict)

#使用Dataloader生成1个brach的图片
data = RAVENDataset(**config["data_params"], pin_memory=len(config['trainer_params']['gpus']) != 0)

data.setup()
experiment = VAEXperiment(model,
                          config['exp_params'])

test_input, test_label = next(iter(RAVENDataset.test_dataloader(data)))

# test_input, test_label = next(iter(self.trainer.datamodule.test_dataloader()))
test_input = test_input.to(experiment.curr_device)
test_label = test_label.to(experiment.curr_device)

#将图片encode到z值
def forward_to_z(input: Tensor, **kwargs) -> Tensor:
    mu, log_var = model.encode(input)
    z = model.reparameterize(mu, log_var)

    #print(self.decode(z).size())
    return  z

z=forward_to_z(test_input)
# # recons=model.decode(z)
np.save('Data/twobytwo_out/zz.npy',z.detach().numpy())

#从z值decode到图片
recons=model.decode(z)
np.save('Data/twobytwo_out/reconss.npy',recons.detach().numpy())

其中model.encode和model.decode为beta-VAE模型的encode和decode。

另外，在gpu上load模型，进行转化并还原图片效果很好，将z值储存并下载到自己的电脑上以后使用同样的模型和model.decode代码无法还原图片。

而且当调整dataloader一个brach只包含1个图片的时候还原效果也非常不好。

而且通过model.forward计算出的mu值在自己电脑上和在gpu上结果不一样。程序没有随机的因素在里面。如果权重一样不是应该相等吗？不知道为什么会有差异。

我希望能通过模型得到能decode得到清晰图片的稳定z值。能不能帮忙看下问题出在哪呢？谢谢了！

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
有问必答小助手 2022-01-13 19:48
关注
你好，我是有问必答小助手，非常抱歉，本次您提出的有问必答问题，技术专家团超时未为您做出解答

本次提问扣除的有问必答次数，已经为您补发到账户，我们后续会持续优化，扩大我们的服务范围，为您带来更好地服务。

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

后知后觉错误打开文件，应该怎么办网络安全
2022-11-10 15:47

回答 3 已采纳如果当场没有什么异常，现在就不要管他了，这个病毒内容不是长期的，短期没事就不要管他，源文件删掉就好了
购物车listview加减按钮监听 list
2015-10-22 11:48

回答 2 已采纳我以前项目里的，借你参考一下，不难的 ``` public class ShopItemAdapter extends BaseAdapter{ private Context
从2个不同的MySQL表中获取数据 mysql php
2012-03-09 10:45

回答 2 已采纳 Using 'JOIN' will be the best option for extracting the data multiple table... SELECT tab1.*,tab2
Diffusion 扩散模型：论生成领先多样性，GAN太单一；论尊贵清晰度独占鳌头，VAE常失真
2023-12-11 17:20

Debroon的博客后来，Diffusion 扩散模型也是生成模型，且在图像生成上，优于 GAN 和 VAE。扩散模型在生成样本时采用了一种不同的方式，它通过在生成过程中逐渐扩散噪声来生成样本。相反，扩散模型只需要在生成过程中进行逐步的...
使用PHP / PECL OAuth扩展通过POST传递参数 php
2011-03-20 02:35

回答 2 已采纳 In case anyone comes across this looking for the answer, here is what I found works: To perform a
js对象私有变量公有变量问题 javascript
2010-02-06 23:12

回答 2 已采纳 [code="javascript"] function WhoAmI() //定义一个函数WhoAmI { alert("I'm " + this.name + " of " + typeof
VAE的原理+直观理解+公式推导+去噪+异常检测
2022-03-24 16:52

cloudless_sky的博客 1、VAE原理的直观理解使用(VAE)生成建模,理解可变自动编码器背后的数学原理一般设先验分布为标准正态分布，但是也可以是其他分布。 KL项目的是使得q(z|x)与p(z|x)相似，只是后面ELBO经过推导转换成了q(z|x)和...
扩散模型的迁移和应用（DiffusionDet，AR-LDM，MagicVideo，RenderDiffusion，AltDiffusion，VD）
2022-12-10 18:18

上杉翔二的博客本文将整理扩散模型在诸多任务上的实施方案和效果讨论，包括其用于目标检测、图像分割、连贯故事合成、视频生成、3D场景生成和推理、多语言扩展、多模态扩展等任务。
生成式模型 & 生成对抗网络——资料梳理（专访资料 + 论文分类）
2016-08-27 23:52

Solomon1588的博客文献整理题目主要内容 ...4）人像复原；5）图像自动生成 2. 生成对抗网络博弈论中的零和博弈 3. 将GAN用
图像去雾，利用《bringing old photos back to life》训练并修改
2022-01-25 17:38

Alocus_的博客《bringing old photos back to life》是一篇用于老照片修复的论文，论文的故事讲的很好，但是不利于读者的理解，而且代码中的很多细节，论文中并未提到。具体的代码背景等可以查看我之前写的一些文章，本次博客主要...
预测学习：深度生成式模型、DcGAN、应用案例、相关paper
2018-06-05 15:08

wishchin的博客大模型需要更大量的数据，用以拟合更复杂的假设空间。GAN本身可以用于生成数据，在GAN的学习过程中隐藏了弱监督学习和增强学习的思想。下文主要是对GAN应用于NLP进行相关分析，配图不错，摘抄下来，删除掉关于NLP的...
AIGC算法工程师面试八股文
2023-09-02 10:36

沉迷单车的追风少年的博客 Diffusion Models和VAE中的重参数化技巧是如何使用的？ VAE中的重参数化技巧 Diffusion Models中的重参数化技巧 3、什么是马尔可夫过程？DDPM中的马尔可夫链是如何定义的？马尔可夫过程 DDPM马尔可夫链 4、为什么DD...
工业缺陷检测深度学习方法综述——学习笔记（评价：这篇华科大的文章错误百出，学术一点都不严谨，别误人子弟了好吧。。。）
2023-12-21 17:29

源代码•宸的博客本综述旨在对工业缺陷检测的任务定义、难点、挑战、主流方法、公共数据集及评价指标等进行全面归纳, 以帮助研究人员快速了解该领域. 具体而言, 本文首先介绍工业缺陷检测的背景与特点. 接着, 按照实际数据标注情况,...
MATLAB算法实战应用案例精讲-【深度学习】多尺度特征融合-目标检测（论文篇五）
2023-04-15 00:15

林聪木的博客检测的图像，首先设置输入网络大小，然后将滑动窗口按照一定步长对图像进行滑动，微小的卷积神经网络，其使用卷积核在卷积神经网络中对输入图像信息进行卷积处理，传统行人检测技术进行分析，然后介绍基于深度学习...
【论文阅读】Animate Anyone: Consistent and Controllable Image-to-Video Synthesis for Character Animation
2023-12-21 21:00

李加号pluuuus的博客在第二阶段，我们将时间层引入到之前训练的模型中，并使用 AnimateDiff 中的预训练权重对其进行初始化。模型的输入由 24 帧视频剪辑组成。在此阶段，我们仅训练时间层，同时固定网络其余部分的权重。思考：第一...
MyDLNote-Enhancement: CVPR2020 基于不变表示学习的非监督图像修复算法
2020-07-31 17:14

Phoenixtree_DongZhao的博客建立了一种基于跨域转移的无监督图像恢复框架，训练效果更好，收敛速度更快 Related Work In general, DNNs-based methods could realize superior results on synthetic noise removal via effective supervised ...
2021计算机视觉-包揽所有前沿论文源码 -下半年
2021-09-14 15:06

江南才尽，年少无知！的博客为了解决大家的这个困扰，本人决定收集2021年上半年大部分前沿的网络相关链接，之后我会(文末附带\color{blue}{文末附带}文末附带公众号−\color{blue}{公众号 -}公众号−海量资源。\color{blue}{ 海量资源}。海量...
Stable Diffusion教程
2023-06-03 23:21

艾克华的博客 Stable Diffusion是一种潜在扩散模型（Latent Diffusion Model），能够从文本描述中生成详细的图像。它还可以用于图像修复、图像绘制、文本到图像和图像到图像等任务。简单地说，我们只要给出想要的图片的文字描述在...
【论文阅读】（20230410-20230416）论文阅读简单记录和汇总
2023-04-11 02:03

倘若我问心无愧呢丶的博客（这一点也很有意思，那么对于相同直方图的图像可以仅采用一个INR进行压缩，只需要改变他的哈希表即可）该表格也验证了现有方法在拟合图像时会趋向于拟合图像的低频部分，而对高频部分的拟合训练缓慢，这也是INR...
论文阅读记录 1-50篇 20190410-20200316
2019-04-19 15:58

Trade Off的博客 Stage-I 进行重构训练，当该模型用于推断的训好后，Stage II利用VAE模拟人对mask的修改，得到两张M_outer和M_inter，利用Stage-I的网络生成两张图片I_outer和I_inter；并训练一个网络进行Blend来辅助生成网络的训练...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 1月20日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 1月13日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月12日

悬赏问题

¥30 这是哪个作者做的宝宝起名网站
¥60 版本过低apk如何修改可以兼容新的安卓系统
¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
¥50 有数据，怎么建立模型求影响全要素生产率的因素
¥50 有数据，怎么用matlab求全要素生产率
¥15 TI的insta-spin例程
¥15 完成下列问题完成下列问题
¥15 C#算法问题, 不知道怎么处理这个数据的转换
¥15 YoloV5 第三方库的版本对照问题
¥15 请完成下列相关问题！

训练好的beta-VAE模型（效果很好）对于单张图片无法利用模型（权重）进行图片复原，如何解决？

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新