VAE模型如何输出结果

VAE代码，模型跑通了，用evaluate函数输出了loss就可以了，但不知道如何根据loss和原始数据计算TP、FP、TN、FN这四个指标，再通过这4个指标来计算准确率、F-score这些数值，以及画出ROC曲线、计算AUC面积。使用的数据集为CICIoT2023，X_train为训练集，Y_test为测试集，Y_test_normal和Y_test_abnormal为测试集正常和异常部分。

import numpy as np
import tensorflow as tf
from tensorflow.keras.layers import Input, Dense, Lambda, Conv1D, Flatten, SpatialDropout1D, Reshape
from tensorflow.keras.models import Model, Sequential
from tensorflow.keras import backend as K
from sklearn.preprocessing import MinMaxScaler, StandardScaler
import pandas as pd
import time
# 读取数据
csv_path_train = 'CICIoT2023/CICIoT2023/benign.csv'
X_train = pd.read_csv(csv_path_train).values
X_train = np.nan_to_num(MinMaxScaler().fit_transform(StandardScaler().fit_transform(X_train)))
X_train = np.reshape(X_train, (-1, 100, 46))

csv_path_test = 'CICIoT2023/CICIoT2023/ceshi.csv'
Y_test = pd.read_csv(csv_path_test)
Y_test_normal = Y_test[Y_test.label == 'BenignTraffic'].drop(labels='label', axis=1).values
Y_test_normal = np.nan_to_num(MinMaxScaler().fit_transform(StandardScaler().fit_transform(Y_test_normal)))
Y_test_normal = np.reshape(Y_test_normal, (-1, 100, 46))
Y_test_abnormal = Y_test[Y_test.label != 'BenignTraffic'].drop(labels='label', axis=1).values
Y_test_abnormal = np.nan_to_num(MinMaxScaler().fit_transform(StandardScaler().fit_transform(Y_test_abnormal)))
Y_test_abnormal = np.reshape(Y_test_abnormal, (-1, 100, 46))

original_dim = 46  # 特征维度
latent_dim = 2  # 潜在空间维度
intermediate_dim = 256
batch_size = 100


# 采样函数
def sampling(args):
    z_mean, z_log_var = args
    batch = K.shape(z_mean)[0]
    dim = K.int_shape(z_mean)[1]
    epsilon = K.random_normal(shape=(batch, dim))
    return z_mean + K.exp(0.5 * z_log_var) * epsilon


# 编码器
inputs = Input(shape=(100, original_dim))
x = Conv1D(64, kernel_size=3, activation='relu', padding='same')(inputs)
x = Flatten()(x)
z_mean = Dense(latent_dim)(x)
z_log_var = Dense(latent_dim)(x)
z = Lambda(sampling, output_shape=(latent_dim,))([z_mean, z_log_var])
encoder = Model(inputs, [z_mean, z_log_var, z], name='encoder')

# 解码器
latent_inputs = Input(shape=(latent_dim,))
x = Dense(100 * 64, activation='relu')(latent_inputs)
x = Reshape((100, 64))(x)  # 将展平的层重新调整为三维
x = Conv1D(64, kernel_size=3, activation='relu', padding='same')(x)
outputs = Conv1D(original_dim, kernel_size=3, activation='sigmoid', padding='same')(x)
decoder = Model(latent_inputs, outputs, name='decoder')

# VAE模型
outputs = decoder(encoder(inputs)[2])  # 连接编码器和解码器
vae = Model(inputs, outputs, name='vae')

# 定义损失函数
reconstruction_loss = tf.keras.losses.binary_crossentropy(K.flatten(inputs), K.flatten(outputs))
reconstruction_loss *= 100  # 对应维度
kl_loss = 1 + z_log_var - K.square(z_mean) - K.exp(z_log_var)
kl_loss = K.sum(kl_loss, axis=-1) * -0.5
vae_loss = K.mean(reconstruction_loss + kl_loss)
vae.add_loss(vae_loss)
vae.compile(optimizer='adam')

test_first_d = Y_test_abnormal.shape[0]

print(f"test_normal:{Y_test_normal.shape[0]}")
print(f"test_abnormal:{Y_test_abnormal.shape[0]}")

# 训练VAE
startTime = time.time()  # 开始时间
vae.fit(X_train, epochs=100, batch_size=batch_size, validation_data=(Y_test_normal, None))
losssum1=0
losssum2=0
for i in range(1,batch_size):
    loss11=vae.evaluate(Y_test_normal)
    losssum1=+loss11
    loss22 = vae.evaluate(Y_test_abnormal)
    losssum2=+loss22
    print(f"loss1:{loss11}")
    print(f"loss2:{loss22}")

endTime = time.time()        #结束时间

print(f"Took {round((endTime - startTime), 5)} seconds to calculate.")
vae.summary()

print("Testing data shape:", Y_test_normal.shape)
result = vae.evaluate(Y_test_normal)
print("Evaluate result:", result)

loss1 = vae.evaluate(Y_test_normal)
loss2 = vae.evaluate(Y_test_abnormal)
print(f"loss1:{loss1}")
print(f"loss2:{loss2}")


# 假设 time_steps 应该等于 test_first_d
#input_data1 = np.expand_dims(np.ones((test_first_d, 1)), axis=2)  # 在最后一个轴上增加一个维度
# 或者使用 reshape 方法
input_data1 = np.ones((test_first_d, 1, 1)).reshape((test_first_d, 1, 1))
acc_normal = vae.evaluate(input_data1)

#input_data2 = np.expand_dims(np.zeros((test_first_d, 1)), axis=2)  # 在最后一个轴上增加一个维度
input_data2 = np.zeros((test_first_d, 1, 1)).reshape((test_first_d, 1, 1))
acc_abnormal = vae.evaluate(input_data2)
#_, acc_normal = vae.evaluate(Y_test_normal, np.ones((test_first_d, 1)))
#_, acc_abnormal = vae.evaluate(Y_test_abnormal, np.zeros((test_first_d, 1)))
#acc_normal = vae.evaluate(np.ones((test_first_d, 1)))
#acc_abnormal = vae.evaluate(np.zeros((test_first_d, 1)))
print(f"acc_normal:{acc_normal}")
print(f"acc_abnormal:{acc_abnormal}")
TP = acc_normal
TN = 1 - TP
FN = acc_abnormal
FP = 1 - FN
precision = TP / (TP + FP)
recall = TP / (TP + FN)
f1 = 2 * (precision * recall) / (precision + recall)
endTime = time.time()  # 结束时间

print(f"acc:{(acc_normal + acc_abnormal) * 50}%")
print(f"precision:{precision}")
print(f"recall:{recall}")
print(f"F1-score:{f1}")

打印结果和报错截图：


![img](https://img-mid.csdnimg.cn/release/static/image/mid/ask/5ef574ab9bb44744be722a6532742be3.png "#left")

![img](https://img-mid.csdnimg.cn/release/static/image/mid/ask/1ac9a49395ad4b6483d77f1b31e9033e.png "#left")

![img](https://img-mid.csdnimg.cn/release/static/image/mid/ask/26af5bdf431f4c3aac50297d578d953c.png "#left")

![img](https://img-mid.csdnimg.cn/release/static/image/mid/ask/8f658900cfee42af86d39075c53c06db.png "#left")

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

24条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 优质创作者: 编程框架技术领域 2024-11-18 23:22
关注
以下回复引自免费微信小程序：皆我百晓生。如问题解决，还请采纳。如仍有疑问，请回复留言或私信博主，以便获得更精准的帮助。

在使用VAE（VARIATIONAL AUTOENCODER）进行生成对抗网络训练时，通常会通过评估生成图像的损失来衡量模型的表现。然而，在实际操作中，为了获得更精确的结果，需要对生成图像的损失进行进一步分析，并根据损失值计算出相应的指标，例如TP、FP、TN、FN等。

TP：这是一个混淆矩阵中的一个术语，表示混淆矩阵中每个类别出现的样本数量。这个指标可以帮助我们了解哪些类别的样本被误分类，这对于提高模型的鲁棒性和泛化能力至关重要。

FP：同样是一个混淆矩阵中的术语，它表示混淆矩阵中某个类别出现的数量减去预测该类别正确的数量。这个指标可以用来检查模型对于假阳性错误的处理是否足够。

TN：与TP相反，它是混淆矩阵中某类别的正确样本数量减去误分类的样本数量。这个指标可以帮助我们理解模型对真实负样例的识别情况。

FN：这个指标是混淆矩阵中某个类别的所有样本数量减去预测该类别的错误样本数量。这个指标用于检测模型在未发生错误的情况下如何区分正负样本。

F-SCORE：这是一种统计学方法，主要用于比较两个或多个分类器的性能。F-SCORE的公式为：

F-SCORE = 2 * (TP + TN) / (TP + FP + FN)

计算准确性、F-SCORE等指标的方法如下：

正确性：首先确保你的混淆矩阵是正确的，然后计算TP、FP、TN、FN。
准确性：计算TP、FP、TN、FN后，将它们相加得到总准确度。如果这个数字接近1，则意味着模型的准确性较高。

最终的准确率可以通过以下公式计算：

准确率 = TP / (TP + FP) 或者准确率 = TN / (TN + FN)

可以通过计算F-SCORE来量化模型的性能，公式如下：

F-SCORE = 2 * (TP + TN) / (TP + FP + FN)

由于F-SCORE通常大于1，这意味着模型的性能比预期更高，反之亦然。

请注意，这些指标可能因具体任务的不同而有所不同。在实际应用中，你可能还需要考虑其他因素，比如优化器的选择、学习率的调整等，以达到最佳效果。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

VAE模型（详细推导+实例代码）
2023-10-12 14:03

zipper112的博客本文会从EM算法，GMM模型一步一步的的推导，在过渡到VAE模型，如果有熟悉的部分可以跳过。最后参考的资料会被列出在末尾。 EM算法思路首先回顾一下EM算法的过程：假设X是全体样本，θ\thetaθ是全体参数。那么MLE...
大模型LLM-输出的多样性
2024-12-03 16:18

网络安全小凯的博客 Prompt Engineering 是一种技术，通过精心设计的文本提示来激发和指导语言模型，使其能够完成特定的任务或生成特定的内容。
Python Pytorch框架使用VAE重新生成MNIST数据集
2025-08-22 13:58

由于VAE模型的这些特性，它在许多领域都得到了广泛的应用，包括图像处理、语音识别以及自然语言处理等。此外，VAE模型还为生成对抗网络（GAN）等其他深度学习模型的发展提供了理论基础。因此，掌握VAE模型的构建和...
vae from scratch 从零开始学vae python pytorch
2025-04-28 15:24

Python是一种广泛使用的高级编程语言，以其简洁明了的语法和强大的社区支持而闻名。在深度学习领域，Python有着极高的活跃度，尤其是搭配上PyTorch这样的深度学习框架，使得复杂的神经网络模型设计和实现变得更加...
基于Python和VAE模型实现网络流量异常检测结合联邦学习与蒸馏学习源代码文档说明模型高分项目
2025-07-25 17:20

本项目基于Python编程语言，采用变分自编码器（VAE）模型，并融合了联邦学习与蒸馏学习两种先进的机器学习技术，构建了一个高效且具有高准确度的网络流量异常检测系统。这样的系统能够帮助网络管理员及时发现和应对...
pyroVED:Pyro概率编程语言中的变编码器/解码器模型
2021-04-02 10:06

pyroVED是一个基于Pyro概率编程语言的开源软件包，用于将变分编码器/解码器模型应用于光谱和图像分析。当前可用的模型包括具有平移和/或旋转不变性的变分自动编码器，用于无监督，类条件和半监督学习，以及im2spec...
基于Python的VAE模型网络流量异常检测系统：融合联邦学习与蒸馏学习算法
2025-11-23 12:11

本项目运用Python编程语言，结合变分自编码器架构，构建了一个网络流量异常识别系统，并融合了联邦学习与知识蒸馏技术。项目资料包含完整源代码、技术文档及预训练模型，属于学术评价较高的研究成果。项目代码已...
变分自编码器的扩展模型:条件VAE
2024-04-08 12:39

程序员光剑的博客近年来,变分自编码器...然而,标准的VAE模型无法对生成的内容进行控制,这限制了它在实际应用中的灵活性。为了解决这一问题,研究人员提出了条件变分自编码器(Conditional Variational Autoencoder, CVAE)模型。
Python-在PyTorch中实现不同的基于VAE的半监督和生成模型
2019-08-11 07:26

通过深入学习和理解这些内容，你可以掌握如何在PyTorch中构建和优化VAE模型，如何将它们应用于半监督学习场景，并了解如何处理实际数据集。此外，这也能帮助你理解如何评估生成模型的性能，并进一步提升模型的泛化...
《异常检测——从经典算法到深度学习》26 Time-LLM：基于大语言模型的时间序列预测
2024-03-03 23:16

smile-yan的博客基于大模型的时间序列预测。
基于 PyTorch 的各类神经网络模型实现方法
2025-08-14 08:41

在深度学习领域，PyTorch是一个广泛使用的开源机器学习库，它基于Python编程语言设计，提供了强大的计算图功能和灵活的神经网络架构。本文档《基于 PyTorch 的各类神经网络模型实现方法》详细介绍了如何利用PyTorch...
一、LLM 大语言模型初窥：起源、概念与核心原理
2025-04-12 12:34

耿雨飞的博客大模型通过参数规模、模态融合与训练效率的突破，重构了技术范式、产业生态与人机关系。未来，AI将不仅是效率工具，更是推动社会生产力跃迁的核心引擎，其发展需在技术创新与伦理治理间寻求动态平衡。生成式模型是一...
自然语言处理之文本生成：变分自编码器(VAE)：概率图模型与贝叶斯网络
2025-05-26 21:45

zhubeibei168的博客变分自编码器（Variational Autoencoder，简称VAE）是一种深度学习模型，它结合了自编码器（Autoencoder）和概率图模型的思想，主要用于生成模型的任务，如图像生成、文本生成等。VAE的核心在于它不仅学习数据的压缩...
自回归语言模型GPT在AIGC文本生成中的应用与优化【附核心代码】
2024-12-31 00:28

一键难忘的博客 AIGC在文本生成中的应用，主要依赖于**自然语言处理（NLP）*和*生成模型。# 加载预训练的GPT-2模型和tokenizer# 输入一个较长的文章文本"""# 将文章文本编码为模型输入格式# 生成摘要文本# 解码生成的摘要文本。
条件VAE(CVAE)：控制生成结果
2024-04-27 15:03

AGI大模型与大数据研究院的博客 1. 背景介绍近年来，深度学习领域中生成模型取得了显著进展，其中变分自编码器（VAE）和生成对抗网络（GAN）成为...然而，传统的 VAE 模型存在一个局限性：无法控制生成结果的特定属性。为了解决这个问题，条件变分自
超越大语言模型：探索’世界模型’！
2025-08-26 09:32

乔代码嘚的博客世界模型"正成为人工智能领域的新焦点，从学术研究到商业应用都展现出巨大潜力。学术界从萨顿的Dyna架构到Meta的V-JEPA2，逐步突破传统AI的局限；产业界如NVIDIA更将其视为十万亿美元级机器人产业的关键。Yann ...
vae
2021-03-19 02:57

【标题】: "Variational Autoencoder (VAE) 深度学习模型解析" 【描述】: "Variational Autoencoder（变分自编码器）是一种基于概率理论的深度学习模型，它结合了自编码器的无监督学习能力与贝叶斯方法的不确定性...
VAE损失函数解析[源码]
2025-12-23 06:05

在软件开发过程中，特别是当使用Python这样的编程语言时，有许多开源库可以帮助实现复杂的数学公式，如TensorFlow或PyTorch等深度学习框架。这些框架提供了自动微分的能力，可以让开发者专注于模型架构和损失函数的...
生成模型在计算机视觉、自然语言处理、推荐系统中的应用和研究
2023-08-07 00:34

程序员光剑的博客随着计算机的飞速发展，人工智能技术的逐渐成熟，越来越多的人开始关注这个新兴的领域，开始开发出新的产品和服务。...通过训练一个生成模型，可以从父亲的基因中产生出一个系列可能的孩子的基因序列，
大语言模型原理与工程实践：核心架构
2024-11-15 03:27

程序员光剑的博客大语言模型（Large Language Model），顾名思义，是一种能够理解和生成自然语言的大规模神经网络模型。其核心目标是通过大规模的数据训练，使得模型能够对输入的自然语言文本进行理解、生成、预测等操作。这种模型的...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 11月20日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月18日

VAE模型如何输出结果

24条回答 默认 最新

问题事件

24条回答默认最新