SVM训练集和测试集的划分

怎么做到训练前90%行并测试最后10%行？在test.size和train.size可以设置吗？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
heart_6662 2022-12-28 18:35
关注
望采纳！点击该回答右侧的“采纳”按钮即可采纳！！
可以使用pandas的sample方法来随机选择数据的行，然后使用train_test_split函数将数据分为训练集和测试集。

代码我给你写了一份，有用可以采纳博主的答案呀

import pandas as pd from sklearn.model_selection import train_test_split 读取数据 data = pd.read_csv('data.csv') 随机选择数据的行 data_sample = data.sample(frac=1) 取前90%的数据作为训练集，剩余的数据作为测试集 train_size = int(len(data_sample) * 0.9) train = data_sample[:train_size] test = data_sample[train_size:] 也可以使用train_test_split函数将数据分为训练集和测试集 X = data_sample.iloc[:, :-1] y = data_sample.iloc[:, -1] X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.1, random_state=42) print('训练集大小:', len(X_train)) print('测试集大小:', len(X_test))
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

SVM训练集和测试集的划分 python
2022-12-28 17:55

回答 1 已采纳望采纳！点击该回答右侧的“采纳”按钮即可采纳！！可以使用pandas的sample方法来随机选择数据的行，然后使用train_test_split函数将数据分为训练集和测试集。代码我给你写了一份，有
请问cross_val_score的scoring参数获得的r2得分是训练集还是测试集的分数 python sklearn 机器学习
2023-01-26 16:39

回答 2 已采纳回答不易，求求您采纳点赞哦 cross_val_score函数中的scoring参数获得的R2得分是测试集的分数。交叉验证（cross-validation）是一种评估模型泛化能力的方法，它将训练
在Matlab2021A，SVM做测试集SVM预测结果对比(RBF核函数时，提示错误使用 plot 向量长度必须相同。不知道该怎么该，希望能解决一下 c++ matlab 支持向量机有问必答
2021-11-10 10:33

回答 1 已采纳你好，你的从2开始了，test_label的长度和predict_label_2应该是相等的。所以建议71改成 plot(1:length(test_label), predict_label_2,'
训练集与测试集数据分布不一致
2022-02-10 11:45

懒编程-二两的博客简介数据质量的高低是决定使用机器学习算法获得预测结果质量高低的重要因素，在很多常见任务中，数据质量的作用远大于模型的作用，本文讨论数据预处理时会遇到的一个常见问题：训练集与测试集数据分布不...
线性和非线性模型如何组合在一起 r语言
2023-03-07 14:15

回答 4 已采纳参考GPT和自己的思路，ARIMA-GARCH和SVM是两种不同类型的模型，ARIMA-GARCH是时间序列模型，而SVM是非线性回归模型。通常情况下，这些模型不能直接组合在一起，因为它们所涉及的数据
svm手写体数字识别不收敛 python 有问必答
2021-07-18 00:39

回答 2 已采纳识别不收敛是因为迭代次数不够，在LinearSVC函数里增加参数 max_iter=2000试试(默认为1000)
分离数据集老是出现错误 python sklearn 有问必答机器学习
2022-03-09 00:23

回答 2 已采纳报错应该是在 dataset.hist那条语句，其中参数名写错了，两个参数分别是 xlabelsize和 ylabelsize，x,y不要写成大写的，改成如下： dataset.hist(sharex
mnist数据集svm python_python支持向量机分类MNIST数据集
2021-02-07 03:23

weixin_39845613的博客调用sklearn.svm的svc函数，将MNIST数据集进行分类，并将整体分类精度输出，这里用了两种预处理的方法(将特征值变成0或者1的数；将特征值变成0-1区间的数)效果不一样，并且分别调用了两种核函数(高斯核函数和多项式...
人工智能导论模型与算法书的课后题实在不会好商量支持向量机机器学习svm 分类边界错误率分离边界发生变化实现，考虑一个在二维特征空间中的二类分析问题，训练集包含八个样本其在二维空间中的分布如图人工智能机器学习
2022-05-19 10:12

回答 1 已采纳理解支持向量，bargin的含义就行，支持向量机的分类超平面只和支持向量样本有关
SVM算法分类出现了0标签 erlang 机器学习问答团队
2021-01-11 15:46

回答 2 已采纳 1.预测的标签本来就可以不在你设置的标签范围内。 2.你这些预测标签为0的样本有问题
使用lr、xgboost或者svm模型，给定技能点和公司来预测薪资 python 回归机器学习
2023-01-03 17:14

回答 1 已采纳可以参考如下项目，是基于拉勾网的数据，构建的建模流程，其中的特征部分可以扩充，替换成你提到的技能点。技能点可以作为category变量，做一下编码。 https://github.com/MaxLy
训练集和测试集（神经网络开篇知识点）
2017-07-05 10:38

berry_K的博客测试和训练集用于智能系统，机器学习，遗传编程和统计。二者关系：在训练分类器期间，只有训练集可用。在训练分类器期间不得使用测试集。测试集仅在测试分类器期间可用。 测试集是独立于训练数据但是遵循与...
使用SVM对手写体数字图片分类，python报错 python 机器学习
2022-11-11 15:16

回答 1 已采纳参考：使用svm对手写体数字图片进行分类_Walt_像道光的博客-CSDN博客 import pandas as pdfrom sklea
基于svm的鸢尾花数据集分类
2020-09-12 16:29

陌忆@的博客主要采取matlab中自带的数据集：鸢尾花数据集，有三个类别且每个类别具有4个属性，先建立三个二分类向量机，采用K-fold（交叉验证）对数据集进行划分，获取训练数据和测试数据，使用训练集进行训练，得出超平面的...
NLP任务常见数据集介绍
2023-08-24 12:05

禅与计算机程序设计艺术的博客自然语言处理（Natural Language Processing， NLP）是计算机科学领域的一个重要方向，是一门融语言学、计算机科学、数学于一体的科学。其中文本处理（Text Processing）是NLP的一个重要子领域。文本处理的任务可以...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 1月5日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 12月28日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月28日

悬赏问题

¥170 如图所示配置eNSP
¥20 docker里部署springboot项目，访问不到扬声器
¥15 netty整合springboot之后自动重连失效
¥15 悬赏！微信开发者工具报错，求帮改
¥20 wireshark抓不到vlan
¥20 关于#stm32#的问题：需要指导自动酸碱滴定仪的原理图程序代码及仿真
¥20 设计一款异域新娘的视频相亲软件需要哪些技术支持
¥15 stata安慰剂检验作图但是真实值不出现在图上
¥15 c程序不知道为什么得不到结果
¥15 键盘指令混乱情况下的启动盘系统重装

SVM训练集和测试集的划分

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新