使用SVM对手写体数字图片分类，python报错

使用SVM对手写体数字图片分类

import pandas as pd
from sklearn import svm
import joblib
print("1.载入训练数据，对训练数据进行标准化")
train_data = pd.read_csv ('digits_training.csv')
# print(data)
# 分类属性
yTrain = train_data.values[:,0]
# 特征属性
xTrain = train_data.values[:,1:]

# 标准化函数
def normalization(X):
    return (X-X.mean())/X.max()
# print("xTrain:{0}".format(xTrain.shape))
# 对特征属性进行标准化处理
xTrain = normalization(xTrain)
# print(xTrain.shape[1])
# print(xTrain.shape)
print("训练数据：",xTrain.shape[0],"条")

# 构建模型
'''
默认核函数是 ‘rbf’-->就是radial basis function keranl (径向基核函数)
模型准确率约为0.89
使用线性核函数（linear）构建模型，准确率在0.908左右
线性核函数主要用于线性可分的情况
在特征数量相对于样本数量非常多的时候，适合采用线性核函数
'''
model = svm.SVC(decision_function_shape='ovo',kernel='linear')
print("2.训练模型……")
model.fit(xTrain,yTrain)
print("3.保存模型……")
joblib.dump(model,"model/svm_classifier_model1.m")
print("4.加载测试数据，对测试数据进行标准化……")
test_data = pd.read_csv("digits_testing.csv")
yTest = test_data.values[:,0]
xTest = test_data.values[:,1:]
print("测试数据：",xTest.shape[0],"条")
xTest = normalization(xTest)
print("5.加载测试好的模型，进行预测……")
model = joblib.load("model/svm_classifier_model1.m")
result =model.predict(xTest)
print("预测错误数据：",(result!=yTest).sum())
print("测试数据正确率：",(result==yTest).sum()/len(yTest))
print("模型内构建正确率估计：",model.score(xTest,yTest))

报错如下：

文件夹里的数据集：

'model/svm_classifier_model1.m'这个文件是干嘛的呀？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
submarineas 2022-11-12 13:47
关注
参考：
使用svm对手写体数字图片进行分类_Walt_像道光的博客-CSDN博客 import pandas as pdfrom sklearn import svmimport joblibprint(“1.载入训练数据，对训练数据进行标准化”)train_data = pd.read_csv (‘dataset/digits_training.csv’)print(data)分类属性yTrain = train_data.values[:,0]特征属性xTrain = train_data.values[:,1:]标准化函数def normalization(X https://blog.csdn.net/m0_45426399/article/details/110528737

这是预训练好的模型

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

基于SVM+HOG的手写体数字识别
2018-07-03 10:58

wf3865的博客用的是HOG+SVM来进行手写体数字识别。现在都是用神经网络来进行手写体的识别。但是老的方法有些时候还是很好用的。这篇文章写得很详细了，我在参考这篇文章复现这个小工程的时候遇到了一些问题，主要记录一下这些...
[Python从零到壹] 十六.文本挖掘之词云热点与LDA主题分布分析万字详解
2021-08-10 20:55

Eastmount的博客前一篇文章讲述了数据预处理、Jieba分词和文本聚类知识，这篇文章可以说是文本挖掘和自然语言处理的入门文章。本文将详细讲解文本挖掘领域的词云热点分析和LDA主题分布分析。两万字基础文章，希望对您有所帮助。欢迎...
Python机器学习：从入门到精通
2025-07-18 17:01

莲华君的博客本书将带您，以Python为舟，泛游于算法之海。我们不只传授“术”，更探求其后的“道”——从数据的生灭流转中观照规律，于模型的迭代演进里体悟得失。愿您合上书卷时，收获的不仅是驾驭数据的技能，更有一双洞悉复杂...
Python开发：从入门到精通
2025-07-16 08:45

莲华君的博客用 Python 以“道”驭“术”，将编程思想与实践应用相结合，引导读者不仅掌握Python语言，更能建立科学的编程世界观，最终达到知行合一的境界。
Python深度学习：从入门到精通
2025-07-21 15:39

莲华君的博客 8.5 RNN应用：自然语言处理（文本分类、情感分析）、时间序列预测。第9章：注意力机制与Transformer —— 现代NLP的基石 9.1 注意力（Attention）机制的原理与魅力。 9.2 Transformer架构详解：自注意力、多头注意...
基于Python的HOG+SVM行人检测预警系统pyqt5界面
2021-11-18 15:20

babyai997的博客首先我将简单阐述一下HOG和SVM的原理，当然重点主要是HOG对于SVM已经有很多的资料讲述的很清楚我觉得此处没有必要再详细讲解。...hog svm 行人检测预警系统 pyqt5界面 python编程项目下载： ...
Python计算机视觉编程——第9章图像分割
2022-08-26 15:29

海鸥丸拉面的博客根据选择图像不同，过大的尺寸可能会不适合 Python graph 库，导致报错。变量Kappa决定了近邻像素间的相对权重，随着K值增大，边界将变得更平滑，细节部分也逐渐丢失。 9.1.2 用户交互式分割利用一些方法可以将图割...
Python深度学习：从零基础到项目实战
2026-01-04 13:29

莲华君的博客 8.5 RNN应用：自然语言处理（文本分类、情感分析）、时间序列预测。第9章：注意力机制与Transformer —— 现代NLP的基石 9.1 注意力（Attention）机制的原理与魅力。 9.2 Transformer架构详解：自注意力、多头注意...
前馈神经网络与支持向量机实战 --- 手写数字识别
2022-12-04 16:46

Python-AI Xenon的博客前馈神经网络与支持向量机实战 — 手写数字识别文章目录前馈神经网络与支持向量机实战 --- 手写数字识别一、前馈神经网络介绍二、支持向量机介绍三、数据集说明四、环境准备五、实验要求六、Python代码 ...
Python生成个人CSDN历史博客文章列表及目录
2023-01-13 16:18

程序媛一枚~的博客 # 使用Python构建CSDN历史博客文章列表，并生成目录
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 11月12日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 11月12日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月11日

使用SVM对手写体数字图片分类，python报错

1条回答 默认 最新

问题事件

1条回答默认最新