VAE代码如何画混淆矩阵

VAE代码，使用CICIoT2023数据集，已跑出准确率（accuracy）、召回率（recall）、精确率（precision）和F1值（F1-score），但无法绘制混淆矩阵，即类似下面这种图。求补充代码，画出混淆矩阵。

import numpy as np
import tensorflow as tf
from tensorflow.keras.layers import Input, Dense, Lambda, Conv1D, Flatten, SpatialDropout1D, Reshape
from tensorflow.keras.models import Model, Sequential
from tensorflow.keras import backend as K
from sklearn.preprocessing import MinMaxScaler, StandardScaler
import pandas as pd
import time
from tensorflow.keras import backend as K
# 读取数据
csv_path_train = 'CICIoT2023/CICIoT2023/benign.csv'
X_train = pd.read_csv(csv_path_train).values
X_train = np.nan_to_num(MinMaxScaler().fit_transform(StandardScaler().fit_transform(X_train)))
X_train = np.reshape(X_train, (-1, 100, 46))

csv_path_test = 'CICIoT2023/CICIoT2023/ceshi.csv'
Y_test = pd.read_csv(csv_path_test)
Y_test_normal = Y_test[Y_test.label == 'BenignTraffic'].drop(labels='label', axis=1).values
Y_test_normal = np.nan_to_num(MinMaxScaler().fit_transform(StandardScaler().fit_transform(Y_test_normal)))
Y_test_normal = np.reshape(Y_test_normal, (-1, 100, 46))
Y_test_abnormal = Y_test[Y_test.label != 'BenignTraffic'].drop(labels='label', axis=1).values
Y_test_abnormal = np.nan_to_num(MinMaxScaler().fit_transform(StandardScaler().fit_transform(Y_test_abnormal)))
Y_test_abnormal = np.reshape(Y_test_abnormal, (-1, 100, 46))

original_dim = 46  # 特征维度
latent_dim = 2  # 潜在空间维度
intermediate_dim = 256  #中间层维度
batch_size = 100  #训练时的批量大小


# 采样函数
def sampling(args):
    z_mean, z_log_var = args
    batch = K.shape(z_mean)[0]
    dim = K.int_shape(z_mean)[1]
    epsilon = K.random_normal(shape=(batch, dim))
    return z_mean + K.exp(0.5 * z_log_var) * epsilon


# 编码器
inputs = Input(shape=(100, original_dim))
x = Conv1D(64, kernel_size=3, activation='relu', padding='same')(inputs)
x = Flatten()(x)
z_mean = Dense(latent_dim)(x)
z_log_var = Dense(latent_dim)(x)
z = Lambda(sampling, output_shape=(latent_dim,))([z_mean, z_log_var])
encoder = Model(inputs, [z_mean, z_log_var, z], name='encoder')

# 解码器
latent_inputs = Input(shape=(latent_dim,))
x = Dense(100 * 64, activation='relu')(latent_inputs)
x = Reshape((100, 64))(x)  # 将展平的层重新调整为三维
x = Conv1D(64, kernel_size=3, activation='relu', padding='same')(x)
outputs = Conv1D(original_dim, kernel_size=3, activation='sigmoid', padding='same')(x)
decoder = Model(latent_inputs, outputs, name='decoder')

# VAE模型
outputs = decoder(encoder(inputs)[2])  # 连接编码器和解码器
vae = Model(inputs, outputs, name='vae')

# 定义损失函数
reconstruction_loss = tf.keras.losses.binary_crossentropy(K.flatten(inputs), K.flatten(outputs))
reconstruction_loss *= 100  # 对应维度
kl_loss = 1 + z_log_var - K.square(z_mean) - K.exp(z_log_var)
kl_loss = K.sum(kl_loss, axis=-1) * -0.5
vae_loss = K.mean(reconstruction_loss + kl_loss)
vae.add_loss(vae_loss)
vae.compile(optimizer='adam')

test_first_d = Y_test_abnormal.shape[0]

print(f"test_normal:{Y_test_normal.shape[0]}")
print(f"test_abnormal:{Y_test_abnormal.shape[0]}")

# 训练VAE
startTime = time.time()  # 开始时间
vae.fit(X_train, epochs=100, batch_size=batch_size, validation_data=(Y_test_normal, None))
losssum1=0
losssum2=0
for i in range(1,batch_size):
    loss11=vae.evaluate(Y_test_normal)
    losssum1=+loss11
    loss22 = vae.evaluate(Y_test_abnormal)
    losssum2=+loss22
    print(f"loss1:{loss11}")
    print(f"loss2:{loss22}")

endTime = time.time()        #结束时间

print(f"Took {round((endTime - startTime), 5)} seconds to calculate.")
vae.summary()

print("Testing data shape:", Y_test_normal.shape)
result = vae.evaluate(Y_test_normal)
print("Evaluate result:", result)

loss1 = vae.evaluate(Y_test_normal)
loss2 = vae.evaluate(Y_test_abnormal)
print(f"loss1:{loss1}")
print(f"loss2:{loss2}")

from sklearn.metrics import roc_curve, auc

# 预测部分
def evaluate_vae(X_test, model):
    # 获取重构输出
    reconstructions = model.predict(X_test)
    # 计算重构误差
    reconstruction_errors = np.mean(np.abs(X_test - reconstructions), axis=(1, 2))
    return reconstruction_errors

# 计算阈值
def find_threshold(y_true, y_pred):
    fpr, tpr, thresholds = roc_curve(y_true, y_pred)
    # 选择使FPR和TPR之差最大的阈值
    optimal_idx = np.argmax(tpr - fpr)
    optimal_threshold = thresholds[optimal_idx]
    return optimal_threshold

# 获取重构误差
recon_errors_normal = evaluate_vae(Y_test_normal, vae)
recon_errors_abnormal = evaluate_vae(Y_test_abnormal, vae)

# 合并数据
recon_errors = np.concatenate([recon_errors_normal, recon_errors_abnormal])
labels = np.array([0]*len(recon_errors_normal) + [1]*len(recon_errors_abnormal))

# 找到最佳阈值
optimal_threshold = find_threshold(labels, recon_errors)

# 使用阈值进行二分类
predictions = (recon_errors > optimal_threshold).astype(int)

from sklearn.metrics import confusion_matrix  # 导入混淆矩阵计算函数
# 计算混淆矩阵
cm = confusion_matrix(labels, predictions)
TP = cm[1, 1]
TN = cm[0, 0]
FP = cm[0, 1]
FN = cm[1, 0]

# 计算评价指标
accuracy = (TP + TN) / (TP + TN + FP + FN)
precision = TP / (TP + FP)
recall = TP / (TP + FN)
f1 = 2 * (precision * recall) / (precision + recall)

# 绘制ROC曲线并计算AUC
fpr, tpr, _ = roc_curve(labels, recon_errors)
roc_auc = auc(fpr, tpr)

print(f"Accuracy: {accuracy}")
print(f"Precision: {precision}")
print(f"Recall: {recall}")
print(f"F1 Score: {f1}")
print(f"AUC: {roc_auc}")

# 绘制ROC曲线
import matplotlib.pyplot as plt
plt.figure()
plt.plot(fpr, tpr, label=f'AUC = {roc_auc:.2f}')
plt.plot([0, 1], [0, 1], 'k--')
plt.xlim([0.0, 1.0])
plt.ylim([0.0, 1.05])
plt.xlabel('False Positive Rate')
plt.ylabel('True Positive Rate')
plt.title('Receiver Operating Characteristic')
plt.legend(loc="lower right")
plt.show()

运行结果ROC曲线：

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

37条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
阿里嘎多学长 2025-01-06 23:18
关注
获得6.00元问题酬金
阿里嘎多学长整理AIGC生成，因移动端显示问题导致当前答案未能完全显示，请使用PC端查看更加详细的解答过程

解决方案

混淆矩阵（Confusion Matrix）是机器学习中常用的可视化工具，用于评估模型的性能。要绘制混淆矩阵，你可以使用 Python 和 TensorFlow/Keras 库。

首先，需要将你的模型的预测结果和真实标签存储在 NumPy 数组中。假设你的预测结果存储在 y_pred 中，真实标签存储在 y_true 中。

import numpy as np import matplotlib.pyplot as plt from sklearn.metrics import confusion_matrix # 获取预测结果和真实标签 y_pred = ... # 模型的预测结果 y_true = ... # 真实标签 # 计算混淆矩阵 cm = confusion_matrix(y_true, y_pred) # 绘制混淆矩阵 plt.imshow(cm, interpolation='nearest') plt.title("Confusion Matrix") plt.colorbar() plt.xlabel("Predicted labels") plt.ylabel("True labels") plt.show()

在上面的代码中，我们使用 confusion_matrix 函数计算混淆矩阵，然后使用 imshow 函数绘制混淆矩阵。最后，我们使用 title、xlabel 和 ylabel 函数添加标题和标签。

代码示例

以下是一个完整的示例代码，用于绘制混淆矩阵：

import numpy as np import matplotlib.pyplot as plt from sklearn.metrics import confusion_matrix # 模型的预测结果 y_pred = np.array([0, 0, 1, 1, 1, 0, 1, 0, 1, 1]) # 真实标签 y_true = np.array([0, 0, 0, 1, 1, 0, 1, 0, 1, 1]) # 计算混淆矩阵 cm = confusion_matrix(y_true, y_pred) # 绘制混淆矩阵 plt.imshow(cm, interpolation='nearest') plt.title("Confusion Matrix") plt.colorbar() plt.xlabel("Predicted labels") plt.ylabel("True labels") plt.show()

运行上面的代码将生成一个混淆矩阵图像，用于评估模型的性能。
解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

自然语言处理(Natural Language Processing) 原理与代码实例讲解
2024-06-27 00:40

AGI大模型与大数据研究院的博客自然语言处理(Natural Language Processing) - 原理与代码实例讲解作者：禅与计算机程序设计艺术 / Zen and the Art of Computer Programming 关键词：自然语言处理（NLP）、语言模型、词嵌入
Deep Learning (DL) 原理与代码实战案例讲解
2024-08-24 01:52

光子AI的博客 Deep Learning (DL) 原理与代码实战案例讲解 1. 背景介绍 1.1 问题的由来随着互联网和大数据的爆炸式增长，数据变得越来越丰富且多样，传统的机器学习方法逐渐显示出局限性。深度学习（Deep Lear
OpenAI技术基石：构建通用人工智能的多模态技术矩阵
2025-06-17 12:28

csdn_tom_168的博客当语言大模型掌握思维链推理、图像模型实现4D动态建模、语音系统具备情感理解能力，OpenAI正在重新定义人工智能的技术边界。未来的开发者，将是精通"提示工程"与"模型编排"的AI指挥官，在数字与物理世界融合的新纪元...
Python-用于理解深度学习概念的注释和实验代码
2019-08-11 08:20

在深度学习领域，Python是一种非常重要的编程语言，它拥有丰富的库和工具，使得开发者能够方便地构建、训练和优化复杂的神经网络模型。本资源“Python-用于理解深度学习概念的注释和实验代码”旨在帮助初学者和进阶...
ChatGPT技术原理解析：从RL之PPO算法、RLHF到GPT4、instructGPT
2023-01-06 15:14

v_JULY_v的博客 Decoder的Masked Self-Attention且融合了Codex的代码/推理能力、instruction tuning等技术) + RLHF + PPO3 2023年3月中旬，OpenAI正式对外发布GPT-4，增加了多模态(支持图片的输入形式)，且ChatGPT底层的语言模型...
【AI企业】【信息科学与工程学】计算机科学与自动化第八十篇人工智能数学方程式16 千万级token的大语言模型01
2026-03-21 05:18

flyair_China的博客步骤1：问题形式化与目标定义目标：设计一个支持亿级token上下文的大语言模型（LLM），在推理时能实现秒级处理10万级token，并保障上下文一致性、逻辑相关性、顺序性、可用性等。数学形式化：设上下文长度为 L...
一文速览Llama 3.1——对其92页paper的全面细致解读：涵盖语言、视觉、语音的架构、原理
2024-07-24 12:19

v_JULY_v的博客同时发现这些超参数设置在不同的轮次和数据混合中表现良好举个数据合成的例子，为了涵盖更广泛的编程语言，比如为了丰富SFT数据集中PHP代码的数量，可以通过llama 3把数据集中已有的Python代码翻译成PHP代码最终，...
VLA（视觉-语言-行动模型）介绍
2026-04-14 11:10

70asunflower的博客为了更清晰地理解VLA的革命性，我们有必要将它与两个容易混淆的概念进行对比：模型类型核心能力输入输出类比 VLM (视觉-语言模型) 理解与对话图像 + 文本文本一个聪明的“旁观者”，能看懂画面并描述它。...
Python深度学习：从零基础到项目实战
2026-01-04 13:29

莲华君的博客第2章：数学与编程基础 —— 内功心法 2.1 线性代数：向量、矩阵、张量及其运算（不仅是计算，更是空间的变换）。 2.2 微积分：导数、偏导数、链式法则与梯度（理解变化与优化的语言）。 2.3 概率论与信息论：...
【信息科学与工程学】【数据科学】数据科学领域第三篇数学基础20 高阶数学（三) 通信网络07 6G空天地一体网络+城域网 AI网络的主要数学基础（1）
2026-05-06 17:39

flyair_China的博客基于大语言模型与检索增强生成（RAG）的运维知识图谱自演进与智能推送算法算法：基于大语言模型与检索增强生成（RAG）的运维知识图谱自演进与智能推送算法。推理思考过程： 1. 运维知识大量存在于工程师经验、工单...
Python深度学习：从入门到精通
2025-07-21 15:39

莲华君的博客第2章：数学与编程基础 —— 内功心法 2.1 线性代数：向量、矩阵、张量及其运算（不仅是计算，更是空间的变换）。 2.2 微积分：导数、偏导数、链式法则与梯度（理解变化与优化的语言）。 2.3 概率论与信息论：...
从AlphaGo到ChatGPT：机器学习基础概念的全景式拆解与工程实践思考
2026-04-25 14:34

一个天蝎座白勺程序猿的博客这篇文章，我想抛开那些令人望而生畏的数学公式，用最朴实的语言，结合这些年我在推荐系统和NLP项目中的踩坑经验，把机器学习的基础概念掰开了、揉碎了讲清楚。如果你也是刚入门的新手，或者想系统梳理知识体系的...
【AI视野·今日NLP 自然语言处理论文速览第二十三期】Tue, 28 Sep 2021
2021-09-28 16:27

hitrjj的博客 AI视野·今日CS.NLP 自然语言处理论文速览 Tue, 28 Sep 2021 Totally 84 papers ????上期速览✈更多精彩请移步主页 Daily Computation and Language Papers Using Pause Information for More Accurate Entity ...
AIGC 领域中 DALL·E 2 的潜在价值挖掘
2025-05-22 21:03

光子AI的博客项目实战：基于DALL·E 2 API的创意设计系统开发 5.1 开发环境搭建 5.1.1 工具链配置 编程语言：Python 3.9+ 核心库：openai==0.27.7（DALL·E 2 API客户端）、Pillow（图像处理）、Flask（Web服务）开发工具：...
电商平台的AI 大模型实践：搜索推荐系统是核心，数据质量控制是关键
2024-10-28 02:31

光子AI的博客协同过滤算法的改进与应用基于矩阵分解的协同过滤算法：如SVD（Singular Value Decomposition），通过分解用户-商品评分矩阵，生成用户和商品的潜在特征向量。基于模型的协同过滤算法：如基于矩阵分解的神经网络...
【深度智能】：迈向高级时代的人工智能全景指南
2024-09-16 15:03

小李很执着的博客案例解析： 混淆矩阵：在 scikit-learn 中使用混淆矩阵评估分类模型的性能，分析不同类别的分类错误情况。 ROC 曲线：绘制 ROC 曲线并计算 AUC，评估模型在不同阈值下的性能。第二阶段：深度学习 1. 深度学习...
在课堂中使用 ChatGPT 的 80 个方式（上）
2024-04-01 21:54

绝不原创的飞龙的博客先决条件：建议具有 Python 或 Java 等高级语言的编程经验。 2. 制定学习目标和目标 ChatGPT 可以帮助您快速启动课程开发。从零开始设计新课程可能具有挑战性。您必须整合许多内容。您必须制定课程目标、目标、评估...
AI行业应用：在金融、医疗、教育与制造业的落地案例深度解析
2025-11-16 19:04

zzywxc787的博客文章提供了技术原理、代码示例、流程图（Mermaid格式）、Prompt设计范例和可视化建议，并讨论了数据隐私、模型可解释性等共性挑战。未来趋势包括多模态AI融合、边缘AI普及和绿色AI发展。AI正从实验室走向产业，成为...
自然语言处理nlp全领域综述
2018-07-18 16:05

未济2019的博客自己编程实现一下这个示范程序的算法。再按照项目提供的标准测试集测试自己实现的程序。如果输出的结果与项目中出现的结果不一致，就要仔细查验自己的程序，反复修改，直到结果与示范程序基本一致。如果还是不行，就...
基于深度学习的多模态音乐分类算法研究与实现
2026-01-10 04:36

小途软件的博客 3.3 系统开发环境系统的开发环境如表3-1所示：表3-1 系统开发环境类别名称版本操作系统 Ubuntu 18.04 深度学习框架 TensorFlow 2.5.0 编程语言 Python 3.8.5 CUDA CUDA 11.1 cuDNN cuDNN 8.0.5 音频处理库 ...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 1月14日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月6日

VAE代码如何画混淆矩阵

37条回答 默认 最新

解决方案

代码示例

问题事件

37条回答默认最新