SilyaSophie 2024-12-08 16:50 采纳率: 36.8%

VAE代码2017数据集准确率低

编写的VAE代码，跑2017数据集准确率低，只有0.53，原数据不加标签维度为46，训练集benign.csv 5600行，46列
测试集ceshi 2400行，47列
将数据用PCA主成分分析法降维到5维、16维、32维，准确率变化不大。请问如何提升准确率到0.85或0.9以上？

源代码如下：


import numpy as np
import tensorflow as tf
from tensorflow.keras.layers import Input, Dense, Lambda, Conv1D, Flatten, SpatialDropout1D, Reshape
from tensorflow.keras.models import Model, Sequential
from tensorflow.keras import backend as K
from sklearn.preprocessing import MinMaxScaler, StandardScaler
import pandas as pd
import time
from tensorflow.keras import backend as K
# 读取数据
csv_path_train = 'E:/dataset/CIC-IDS-2017/benign.csv'
X_train = pd.read_csv(csv_path_train).values
# 假设 X_train 是你的输入数据
# 处理无穷大值
X_train = np.where(np.isinf(X_train), np.nan, X_train)  # 将无穷大替换为 NaN
X_train = np.nan_to_num(X_train)  # 将 NaN 替换为 0 或其他适当的值
X_train = np.nan_to_num(MinMaxScaler().fit_transform(StandardScaler().fit_transform(X_train)))
X_train = np.reshape(X_train, (-1, 100, 46))

csv_path_test = 'E:/dataset/CIC-IDS-2017/ceshi.csv'
Y_test = pd.read_csv(csv_path_test)
Y_test_normal = Y_test[Y_test.label == 'Benign'].drop(labels='label', axis=1).values
Y_test_normal = np.where(np.isinf(X_train), np.nan, X_train)  # 将无穷大替换为 NaN
Y_test_normal = np.nan_to_num(X_train)  # 将 NaN 替换为 0 或其他适当的值
print(f"Y_test_normal:{Y_test_normal.shape}")

# 假设 Y_test_normal 是三维的，形状为 (n_samples, n_time_steps, n_features)
# 我们需要将数据重塑为 (n_samples * n_time_steps, n_features)
n_samples, n_time_steps, n_features = Y_test_normal.shape
Y_test_normal_reshaped = Y_test_normal.reshape(n_samples * n_time_steps, n_features)

# 应用 StandardScaler
scaler = StandardScaler()
Y_test_normal_scaled = scaler.fit_transform(Y_test_normal_reshaped)

# 如果需要，再应用 MinMaxScaler（通常不需要两者同时使用）
min_max_scaler = MinMaxScaler()
Y_test_normal = min_max_scaler.fit_transform(Y_test_normal_scaled)

Y_test_normal = np.nan_to_num(MinMaxScaler().fit_transform(StandardScaler().fit_transform(Y_test_normal)))
Y_test_normal = np.reshape(Y_test_normal, (-1, 100, 46))
Y_test_abnormal = Y_test[Y_test.label != 'Benign'].drop(labels='label', axis=1).values
Y_test_abnormal = np.where(np.isinf(X_train), np.nan, X_train)  # 将无穷大替换为 NaN
Y_test_abnormal = np.nan_to_num(X_train)  # 将 NaN 替换为 0 或其他适当的值

n_samples, n_time_steps, n_features = Y_test_abnormal.shape
Y_test_abnormal_reshaped = Y_test_abnormal.reshape(n_samples * n_time_steps, n_features)

# 应用 StandardScaler
scaler = StandardScaler()
Y_test_abnormal_scaled = scaler.fit_transform(Y_test_abnormal_reshaped)

# 如果需要，再应用 MinMaxScaler（通常不需要两者同时使用）
min_max_scaler = MinMaxScaler()
Y_test_abnormal = min_max_scaler.fit_transform(Y_test_normal_scaled)

Y_test_abnormal = np.nan_to_num(MinMaxScaler().fit_transform(StandardScaler().fit_transform(Y_test_abnormal)))
Y_test_abnormal = np.reshape(Y_test_abnormal, (-1, 100, 46))

original_dim = 46  # 特征维度
latent_dim = 2  # 潜在空间维度
intermediate_dim = 256
batch_size = 100


# 采样函数
def sampling(args):
    z_mean, z_log_var = args
    batch = K.shape(z_mean)[0]
    dim = K.int_shape(z_mean)[1]
    epsilon = K.random_normal(shape=(batch, dim))
    return z_mean + K.exp(0.5 * z_log_var) * epsilon


# 编码器
inputs = Input(shape=(100, original_dim))
x = Conv1D(64, kernel_size=3, activation='relu', padding='same')(inputs)
x = Flatten()(x)
z_mean = Dense(latent_dim)(x)
z_log_var = Dense(latent_dim)(x)
z = Lambda(sampling, output_shape=(latent_dim,))([z_mean, z_log_var])
encoder = Model(inputs, [z_mean, z_log_var, z], name='encoder')

# 解码器
latent_inputs = Input(shape=(latent_dim,))
x = Dense(100 * 64, activation='relu')(latent_inputs)
x = Reshape((100, 64))(x)  # 将展平的层重新调整为三维
x = Conv1D(64, kernel_size=3, activation='relu', padding='same')(x)
outputs = Conv1D(original_dim, kernel_size=3, activation='sigmoid', padding='same')(x)
decoder = Model(latent_inputs, outputs, name='decoder')

# VAE模型
outputs = decoder(encoder(inputs)[2])  # 连接编码器和解码器
vae = Model(inputs, outputs, name='vae')

# 定义损失函数
reconstruction_loss = tf.keras.losses.binary_crossentropy(K.flatten(inputs), K.flatten(outputs))
reconstruction_loss *= 100  # 对应维度
kl_loss = 1 + z_log_var - K.square(z_mean) - K.exp(z_log_var)
kl_loss = K.sum(kl_loss, axis=-1) * -0.5
vae_loss = K.mean(reconstruction_loss + kl_loss)
vae.add_loss(vae_loss)
vae.compile(optimizer='adam')

test_first_d = Y_test_abnormal.shape[0]

print(f"test_normal:{Y_test_normal.shape[0]}")
print(f"test_abnormal:{Y_test_abnormal.shape[0]}")

# 训练VAE
startTime = time.time()  # 开始时间
vae.fit(X_train, epochs=200, batch_size=batch_size, validation_data=(Y_test_normal, None))
losssum1=0
losssum2=0
for i in range(1,batch_size):
    loss11=vae.evaluate(Y_test_normal)
    losssum1=+loss11
    loss22 = vae.evaluate(Y_test_abnormal)
    losssum2=+loss22
    print(f"loss1:{loss11}")
    print(f"loss2:{loss22}")

endTime = time.time()        #结束时间

print(f"Took {round((endTime - startTime), 5)} seconds to calculate.")
vae.summary()

print("Testing data shape:", Y_test_normal.shape)
result = vae.evaluate(Y_test_normal)
print("Evaluate result:", result)

loss1 = vae.evaluate(Y_test_normal)
loss2 = vae.evaluate(Y_test_abnormal)
print(f"loss1:{loss1}")
print(f"loss2:{loss2}")

from sklearn.metrics import roc_curve, auc

# 预测部分
def evaluate_vae(X_test, model):
    # 获取重构输出
    reconstructions = model.predict(X_test)
    # 计算重构误差
    reconstruction_errors = np.mean(np.abs(X_test - reconstructions), axis=(1, 2))
    return reconstruction_errors

# 计算阈值
def find_threshold(y_true, y_pred):
    fpr, tpr, thresholds = roc_curve(y_true, y_pred)
    # 选择使FPR和TPR之差最大的阈值
    optimal_idx = np.argmax(tpr - fpr)
    optimal_threshold = thresholds[optimal_idx]
    return optimal_threshold

# 获取重构误差
recon_errors_normal = evaluate_vae(Y_test_normal, vae)
recon_errors_abnormal = evaluate_vae(Y_test_abnormal, vae)

# 合并数据
recon_errors = np.concatenate([recon_errors_normal, recon_errors_abnormal])
labels = np.array([0]*len(recon_errors_normal) + [1]*len(recon_errors_abnormal))

# 找到最佳阈值
optimal_threshold = find_threshold(labels, recon_errors)

# 使用阈值进行二分类
predictions = (recon_errors > optimal_threshold).astype(int)

from sklearn.metrics import confusion_matrix  # 导入混淆矩阵计算函数
# 计算混淆矩阵
cm = confusion_matrix(labels, predictions)
TP = cm[1, 1]
TN = cm[0, 0]
FP = cm[0, 1]
FN = cm[1, 0]

# 计算评价指标
accuracy = (TP + TN) / (TP + TN + FP + FN)
precision = TP / (TP + FP)
recall = TP / (TP + FN)
f1 = 2 * (precision * recall) / (precision + recall)

# 绘制ROC曲线并计算AUC
fpr, tpr, _ = roc_curve(labels, recon_errors)
roc_auc = auc(fpr, tpr)

print(f"Accuracy: {accuracy}")
print(f"Precision: {precision}")
print(f"Recall: {recall}")
print(f"F1 Score: {f1}")
print(f"AUC: {roc_auc}")

# 绘制ROC曲线
import matplotlib.pyplot as plt
plt.figure()
plt.plot(fpr, tpr, label=f'AUC = {roc_auc:.2f}')
plt.plot([0, 1], [0, 1], 'k--')
plt.xlim([0.0, 1.0])
plt.ylim([0.0, 1.05])
plt.xlabel('False Positive Rate')
plt.ylabel('True Positive Rate')
plt.title('Receiver Operating Characteristic')
plt.legend(loc="lower right")
plt.show()

PCA降维代码如下：
import numpy as np
import pandas as pd
from sklearn.preprocessing import StandardScaler,MinMaxScaler
from sklearn.decomposition import PCA

假设你的数据集是一个CSV文件，使用pandas加载

data = pd.read_csv('E:/dataset/CIC-IDS-2017/benign.csv') # 替换为你的CSV文件路径

X = data # 在这个例子中，data已经是一个NumPy数组

假设 X 是你的输入数据

处理无穷大值

X= np.where(np.isinf(X), np.nan, X) # 将无穷大替换为 NaN
X= np.nan_to_num(X) # 将 NaN 替换为 0 或其他适当的值
X= np.nan_to_num(MinMaxScaler().fit_transform(StandardScaler().fit_transform(X)))

数据标准化

scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

PCA降维到16个主成分

pca = PCA(n_components=32)
X_pca = pca.fit_transform(X_scaled)

查看原始数据和降维后数据的形状

print(f"原始数据的形状: {X.shape}")
print(f"降维后的数据形状: {X_pca.shape}")

如果需要将降维后的数据保存为CSV文件，可以使用pandas

df_pca = pd.DataFrame(X_pca, columns=[f'PC{i+1}' for i in range(32)])
df_pca.to_csv('E:/dataset/CIC-IDS-2017/reduced_benign.csv', index=False)

假设你的数据集是一个CSV文件，使用pandas加载

data = pd.read_csv('E:/dataset/CIC-IDS-2017/ceshi1.csv') # 替换为你的CSV文件路径

X = data # 在这个例子中，data已经是一个NumPy数组

假设 X 是你的输入数据

处理无穷大值

数据标准化

scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

PCA降维到9个主成分

pca = PCA(n_components=32)
X_pca = pca.fit_transform(X_scaled)

查看原始数据和降维后数据的形状

print(f"原始数据的形状: {X.shape}")
print(f"降维后的数据形状: {X_pca.shape}")

如果需要将降维后的数据保存为CSV文件，可以使用pandas

df_pca = pd.DataFrame(X_pca, columns=[f'PC{i+1}' for i in range(32)])
df_pca.to_csv('E:/dataset/CIC-IDS-2017/reduced_ceshi1.csv', index=False)

运行结果：

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
恐怖如斯恐怖如斯啊 2024-12-08 16:52
关注
以下回复参考：皆我百晓生、券券喵儿等免费微信小程序作答:

从你提供的代码和描述中，我注意到了一些可能的问题和可能的改进点：

数据预处理：

在读取数据后，你使用了PCA进行降维，但之后的数据预处理（如标准化、归一化）可能不再适用于降维后的数据。你可能需要重新考虑降维后的数据是否需要额外的标准化或归一化。
你在Y_test_normal和Y_test_abnormal的数据预处理中，对Y_test_normal进行了两次标准化和归一化，这是不必要的。

模型训练：

你在训练VAE时，使用了Y_test_normal和Y_test_abnormal作为验证数据，这是不正确的。你应该使用独立的验证集来验证模型的性能。
你计算了每个batch的损失，但你没有在训练过程中使用这些损失进行反馈。通常，我们只关心每个epoch的总损失。

模型评估：

你使用了重构误差来评估模型，这是一个合理的方法，但你可能还想考虑其他的评估指标，如准确率、召回率、F1分数等。
在使用重构误差进行二分类时，你选择了使FPR和TPR之差最大的阈值，这是一个可行的方法，但也可以考虑使用其他的阈值选择方法。

代码结构：

你的代码结构似乎有些混乱，特别是数据预处理部分。你应该尝试重新组织代码，使其更加清晰和易于理解。

模型复杂性：

你的VAE模型相对简单，可能不足以处理如此复杂的数据。你可以考虑增加模型的复杂性，如增加层数、增加节点数或添加其他类型的层。

训练策略：

你可以考虑使用不同的优化器、学习率或批次大小来改进模型的训练。

数据标签：

你的数据标签是Benign和not Benign，但在计算准确率时，你使用了所有标签，包括Benign和not Benign。这可能导致你的准确率计算不正确。你应该只考虑not Benign类别的准确率。

根据你的代码和描述，我建议根据上述建议进行改进，并尝试再次训练你的模型。同时，请确保你有足够的计算资源来训练你的模型，因为训练深度学习模型可能需要大量的时间和计算资源。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

提示词工程在低资源语言翻译中的应用
2025-01-08 02:14

光子AI的博客文章标题：提示词工程在低资源语言翻译中的应用关键词：提示词工程，低资源语言翻译，机器翻译，自然语言处理，优化策略摘要：本文探讨了提示词工程在低资源语言翻译中的应用，从背景与概述、原理与方法、实践应用...
变分自编码器：MNIST数据集图像生成实战
2025-07-04 23:51

夏曦安的博客它依赖于统计学理论，可以处理带有不确定性的数据，是现代机器学习中不可或缺的一部分。概率模型可以根据其表现形式和参数结构被分为多种类别。在基础层面，我们有离散型和连续型概率模型。离散型概率模型处理的是一...
VAE：Variational Auto Encoders Tutorial with PyTorch
2023-07-31 00:52

光子AI的博客 VAE（Variational Autoencoder）是2013年由Kingma和Welling提出的一种高效且可扩展的概率模型，主要用于学习数据分布，其编码器输出的隐变量能够捕捉到潜在的数据结构信息。通过最大化对数似然和最小化KL散度两个...
VAE是一个无监督的自编码器网络，可以用来对数据建模并找到数据的隐藏表示，从而完成数据重构。与其他无监督学习方法（如PCA）不同的是，VAE可以对输入的数据进行任意维度的压缩
2023-07-31 01:12

光子AI的博客 VAE是一个无监督的自编码器网络，可以用来对数据建模并找到数据的隐藏表示，从而完成数据重构。与其他无监督学习方法（如PCA）不同的是，VAE可以对输入的数据进行任意维度的压缩。这使得它在图像处理、文本生成、...
电力系统短期负荷预测附Python代码+数据+详细文章讲解
2025-08-04 09:25

Matlab算法改进和仿真定制工程师的博客准确预测未来数小时至数天内的电力负荷，能够助力电力公司优化发电调度，降低发电成本，增强电网运行稳定性与可靠性，进而有效应对电力市场的动态变化。电力负荷数据具有高度复杂性，其受多种因素影响，如时间周期性...
自然语言处理（NLP）基础知识大全
2023-08-07 00:23

光子AI的博客 19世纪末期，人类开发出了第一台计算机——“电子集中式计算机”，它由电信号和电路组成，用于处理输入数据，并按照指令对数据进行加工处理得到输出结果。随着时代的发展，人们逐渐发现电子计算机在很多领域都具备着...
AI_course-master_castleinn_python数据文件_personmk3_
2021-10-02 11:35

标题中的"AI_course-master_castleinn_python数据文件_personmk3_" 暗示这是一个关于人工智能课程的项目，其中包含了用于Python编程的数据集，特别是与个人数据(personmk3)相关的部分。这个项目可能专注于如何利用...
自然语言处理之文本生成：Variational Autoencoders(VAE)：自动编码器原理与应用
2025-05-26 21:42

zhubeibei168的博客在自然语言处理领域，VAE被用于文本生成，通过学习文本数据的潜在表示，从而生成新的、有意义的文本。VAE的核心在于其变分推断框架，它不仅能够重构输入数据，还能从潜在空间采样生成新的数据。
元编程技术：使AI Agent具备代码生成能力
2025-03-09 17:46

AGI大模型与大数据研究院的博客 7.1 最佳实践代码生成AI Agent设计与应用的最佳实践元编程技术在实际项目中的应用经验7.2 注意事项设计与使用代码生成AI Agent的注意事项元编程技术在AI Agent代码生成中的挑战7.3 拓展阅读相关领域的研究动态推荐...
Human-M3 多模态姿态估计数据集-初步解读
2024-10-12 22:29

彩虹编程的博客在方法部分，作者描述了如何利用多模态数据（RGB图像和点云）来解决3D人体姿态估计问题。提出的MMVP方法展示了简单的体素化方法在融合RGB和点云信息中的有效性，为进一步的多模态3D HPE算法研究提供了一个强有力的...
人工智能和自然语言处理领域的最新研究现状、前沿技术及创新方向
2023-08-06 01:45

光子AI的博客在当下的人工智能和自然语言处理领域快速发展的趋势下，已经出现了许多优秀的研究成果。人们对这些新颖的技术的认识也日渐增长，并在进行相关工作时更加注重客观性、可行性和实用性。
大模型从业方向——数据/平台/算法/部署
2025-01-04 21:56

fpga和matlab的博客监控任务包括跟踪模型的性能指标，如响应时间、准确率等，以及硬件资源的使用情况。优化则是根据监控结果，采取措施提高模型的性能和资源利用效率。 3.算法工程师 3.1搜广推（搜索、广告、推荐）算法在搜索算法中，...
生成模型在计算机视觉、自然语言处理、推荐系统中的应用和研究
2023-08-07 00:34

光子AI的博客随着计算机的飞速发展，人工智能技术的逐渐成熟，...在这个过程中，生成模型是一个非常重要的工具，它可以用来帮助理解复杂的数据集。通过训练一个生成模型，可以从父亲的基因中产生出一个系列可能的孩子的基因序列，
《异常检测——从经典算法到深度学习》26 Time-LLM：基于大语言模型的时间序列预测
2024-03-03 23:16

smile-yan的博客基于大语言模型的时间序列预测论文名称：Time-LLM: Time Series Forecasting by Reprogramming Large Language Models 会议名称：ICLR 2024 下载地址：https://arxiv.org/abs/2310.01728 源码地址：...
提示词编程与传统编程的性能对比
2024-12-22 04:12

光子AI的博客提示词编程与传统编程的性能对比关键词：提示词编程，传统编程，性能对比，优化策略，发展趋势摘要：本文深入探讨了提示词编程与传统编程在性能方面的对比。通过分析两种编程模式的核心概念、算
Python-在PyTorch中实现不同的基于VAE的半监督和生成模型
2019-08-11 07:26

5. **结果展示**：可能会有训练过程中的损失曲线、生成样本的可视化，以及半监督学习任务的性能指标（如分类准确率）。通过深入学习和理解这些内容，你可以掌握如何在PyTorch中构建和优化VAE模型，如何将它们应用...
模式识别：让数据说话，让机器决策
2023-07-15 02:39

光子AI的博客模式识别(Pattern Recognition)是计算机科学的一个子领域，它利用计算机技术从原始数据中提取有用的信息，并对其进行整理、分析和处理，最终达到预测、分类或回归的目的。简单来说，模式识别就是给定一组数据，根据...
用于分子发现的语言模型
2023-12-06 10:24

DrugOne的博客语言模型，尤其是自然语言处理中的Transformers模型，在科学领域的成功应用催生了“科学语言模型”的概念。这些模型专注于小分子、蛋白质或聚合物。在化学领域，语言模型已经开始加速分子发现周期，早期药物发现的有...
频谱数据分析.pptx
2024-05-29 07:40

- **高效压缩算法**：平衡压缩率和数据准确性。 - **自适应压缩策略**：根据不同数据特性自动调整压缩参数。 - **软件定义频谱仪**： - **技术原理**：通过软件定义实现频谱仪的功能。 - **应用场景**：适用于...
深度学习极简教程——神经网络、模式识别、图像处理、语音处理、计算语言学、统计学等基础入门
2023-08-09 03:44

光子AI的博客深度学习的核心算法是反向传播算法（Backpropagation Algorithm），其作用是根据模型的输出误差，自动调整模型参数，使得模型的预测结果更加准确。将输入数据输入到神经网络中，计算网络的输出。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月8日

VAE代码2017数据集准确率低

假设你的数据集是一个CSV文件，使用pandas加载

假设 X 是你的输入数据

处理无穷大值

数据标准化

PCA降维到16个主成分

查看原始数据和降维后数据的形状

如果需要将降维后的数据保存为CSV文件，可以使用pandas

假设你的数据集是一个CSV文件，使用pandas加载

假设 X 是你的输入数据

处理无穷大值

数据标准化

PCA降维到9个主成分

查看原始数据和降维后数据的形状

如果需要将降维后的数据保存为CSV文件，可以使用pandas

1条回答 默认 最新

问题事件

1条回答默认最新