Python，sklearn.svm多分类准确率100%？

问题遇到的现象和发生背景

使用sklearn.svm 解决多分类分体时，测试集的准确率100%

用代码块功能插入代码，请勿粘贴截图

import nibabel as nib
import os
import numpy as np
import sklearn
from sklearn import svm
from sklearn.model_selection import KFold
from sklearn.multiclass import OneVsRestClassifier
from sklearn import preprocessing
import tensorflow as tf

os.chdir("C:/Users/Desktop/hap_nii/hap_nii")  # 设置工作目录
file_chdir = os.getcwd()  # 获得工作目录
# matplotlib.use('TkAgg')
# 文件名，nii或nii.gz

filename_npy = []  # 文件名列表
file_npy = []  # 数据列表
label_npy = []
acc_s_train = []    # 准确率
acc_s_test = []
auc_s = []    # 准确率 （两种不同计算方法的准确率）
#  数据处理（从文件夹中获取数据集，和标签）
for root, dirs, files in os.walk(file_chdir):  # os.walk会便利该目录下的所有文件
    for file in files:
        if os.path.splitext(file)[-1] == '.nii':  # 判断文件格式是否符合nii格式
            filename_npy.append(file)  # 存储文件名
            lab = file[10]  # s102_w1_v1     第七位表示类别
            file_nii = nib.load(file)
            file_niidata = file_nii.get_fdata()
            files_npy = np.squeeze(np.array(file_niidata))
            print(np.shape(files_npy))
            #  每15分一组
            files_len = files_npy.shape[3]
            i = 15
            while i < files_len:
                file_npy.append((files_npy[:, :, :, i-15:i]).flatten())
                label_npy.append(lab)
                i += 15


data = file_npy  # data就是所有数据的存储
label = label_npy
# 转化为数组格式
data = np.array(data)
# 归一化
min_max_scaler = preprocessing.MinMaxScaler()
data = min_max_scaler.fit_transform(data)
label = np.array(label)
label = tf.keras.utils.to_categorical(label)
# 用索引打乱数据
length = len(data)
index = [i for i in range(length)]
np.random.seed(42)
np.random.shuffle(index)
data = data[index]
label = label[index]
rate = 0.1
center = int(float(length) * rate)
train_index = [x for x in range(0, center)]
test_index = [y for y in range(center, length)]
fold_train_data, fold_train_label = data[train_index], label[train_index]
fold_test_data, fold_test_label = data[test_index], label[test_index]
clf = OneVsRestClassifier(svm.SVC(decision_function_shape='ovr', kernel='rbf', C=1))
clf.fit(fold_train_data, fold_train_label)
label_pre = clf.predict(fold_test_data)  # 预测值
label_pre_train = clf.predict(fold_train_data)
acc_test = sum(fold_test_label == label_pre) / len(fold_test_label)
acc_train = sum(fold_train_label == label_pre_train) / len(fold_train_label)
auc = sklearn.metrics.accuracy_score(fold_test_label, label_pre)
acc_s_test.append(acc_test)
acc_s_train.append(acc_train)
auc_s.append(auc)

运行结果及报错内容

训练结果的准确率为100%

我的解答思路和尝试过的方法

我认为主要是这两句代码可能出现了问题

clf = OneVsRestClassifier(svm.SVC(decision_function_shape='ovr', kernel='rbf', C=1))
clf.fit(fold_train_data, fold_train_label)
label_pre = clf.predict(fold_test_data)  # 预测值
label_pre_train = clf.predict(fold_train_data)

我想要达到的结果

解决准确率100%的问题

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2022-11-20 14:41
关注
请看👉 ：Python sklearn SVM自定义核实现和所遇到的问题及解决（完整代码）
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

ModuleNotFoundError: No module named 'sklearn.svm.classes' python
2022-03-11 21:55

回答 2 已采纳大概率因为你的sklearn版本过新的问题（>=0.24）我用的0.23.2，导入这个的时候已经警告该模块（sklearn.svm.classes）会在0.24版本移除了
sklearn集成学习关于算法准确率的两个问题 python 机器学习集成学习
2022-02-05 22:20

回答 1 已采纳第一个问题：根据soft voting和hard voting的定义来看，soft是将所有模型预测样本为某一类别的概率的平均值作为标准，概率最高的对应的类型为最终的预测结果；而hard
用python做SVM模型的分类结果，该怎么做误差分析呀 python 分类有问必答机器学习
2022-11-20 22:23

回答 1 已采纳你好，我是有问必答小助手，非常抱歉，本次您提出的有问必答问题，技术专家团超时未为您做出解答本次提问扣除的有问必答次数，已经为您补发到账户，我们后续会持续优化，扩大我们的服务范围，为您带来更好地服务。
Python sklearn实现SVM鸢尾花分类
2022-10-26 23:46

小嗷犬的博客本文内容：Python sklearn实现SVM鸢尾花分类更多内容请见 Python sklearn实现K-means鸢尾花聚类 Pytorch 基于LeNet的手写数字识别 Pytorch 基于AlexNet的服饰识别（使用Fashion-MNIST数据集）本文目录准备加载...
使用SVM对手写体数字图片分类，python报错 python 机器学习
2022-11-11 15:16

回答 1 已采纳参考：使用svm对手写体数字图片进行分类_Walt_像道光的博客-CSDN博客 import pandas as pdfrom sklea
需要提供二分类问题SVM matlabh或python都行分类支持向量机机器学习
2023-04-21 15:07

回答 9 已采纳引用chatgpt部分指引作答：下面是一个简单的 SVM 二分类器的示例 MATLAB 代码，假设数据已经存储在一个大小为 100x5 的矩阵 X 中，标签存储在一个大小为 100x1 的列向量 Y
关于#takes 1 positional argument but 2 were given #的问题，如何解决？(语言-python) python sklearn 机器学习
2022-05-26 18:58

回答 2 已采纳好像是参数位置变了。你题目中13行改成这个试试self.vectorizer = CountVectorizer(max_df=max_df, stop_words=stopwords, ngram_
基于python-sklearn库的SVM乳腺癌二分类算法
2024-06-27 16:28

### 基于Python-Sklearn库的SVM乳腺癌二分类算法 #### 知识点一：SVM（支持向量机）简介支持向量机（Support Vector Machine，简称SVM）是一种监督学习方法，主要用于分类和回归分析。在机器学习领域，SVM以其...
如何输出svm_predict预测错误的数据？ python
2019-10-11 16:49

回答 1 已采纳没有代码，但是一般来说，svm_predict(你的数据集)，返回的是一个数组，代表预测的结果你拿数据集的标签（实际的结果）和这个数组结果的比较，用zip函数之类的，就可以知道是否正确。
python绘制的ROC曲线与结果不符 python 分类机器学习
2023-03-16 21:13

回答 9 已采纳该回答引用chatGpt根据您提供的信息，所有评价指标都为1，但是ROC曲线不符合预期，这表明评价指标的结果可能不正确。有以下几个问题需要检查和调整：对于多类别问题，需要使用label_binari
python 具有多个返回值，只用一个参数去接受，为什么会出错 python 有问必答
2021-08-24 11:14

回答 5 已采纳星号表达式(*expressoin)不可单独使用可以先执行完函数再赋值
机器学习（验证码识别，python，sklearn，svm）.zip
2024-02-21 19:41

在本项目中，我们主要探讨的是使用机器学习技术来实现验证码识别，具体涉及Python编程语言、scikit-learn（简称sklearn）库以及支持向量机（SVM）算法。验证码识别是计算机视觉领域的一个常见任务，其目标是训练一个...
python中出现错误 ValueError: Series.replace cannot use dict-value and non-None to_replace 如何解决？ python 人工智能有问必答机器学习
2021-11-10 11:12

回答 1 已采纳报错很清楚了，告诉你不能把空替换成数据你可以把任何匹配到的字符替换成空，但是不能倒过来没法把空替换成数据
python-sklearn-用法.docx
2023-06-11 11:20

Scikit-learn，通常简称为sklearn，是Python编程语言中的一个强大机器学习库，它包含了大量的算法和工具，适用于各种机器学习任务，如分类、回归、聚类和降维等。下面将详细介绍如何利用Scikit-learn进行机器学习...
遗传算法优化svm实现多分类
2023-03-25 15:45

6. **Python编程**：使用Python语言实现遗传算法和SVM模型，包括导入相关库（如sklearn和numpy），加载和处理数据，以及训练和验证模型。 7. **实际应用**：在实际的医学数据集上应用SVM和遗传算法，以解决实际的...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 12月2日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
赞助了问题酬金15元 11月24日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月20日

悬赏问题

¥15 这种情况的伯德图和奈奎斯特曲线怎么分析？
¥50 paddleocr带斜线的0很容易识别成9
¥15 电子档案元素采集（tiff及PDF扫描图片）
¥15 flink-sql-connector-rabbitmq使用
¥15 zynq7015,PCIE读写延时偏大
¥15 使用spss做psm（倾向性评分匹配）遇到问题
¥20 vue+UEditor附件上传问题
¥15 想做个WPS的自动化代码，不知道能做的起不。
¥15 uniApp，生成安卓安卓包后，黑暗主题中间内容不生效，底部导航正常
¥15 斯坦福自动漂移非线性模型反解

Python，sklearn.svm多分类准确率100%？

问题遇到的现象和发生背景

用代码块功能插入代码，请勿粘贴截图

运行结果及报错内容

我的解答思路和尝试过的方法

我想要达到的结果

4条回答 默认 最新

问题事件

悬赏问题

4条回答默认最新