从10个人里面随机抽取8个人，跟先将10个人随机排列，再取出前8个人，这两者等价吗？（机器学习hold_out实现）

我要自己实现一个holdout算法，即等比例地从数据集中抽取一定的样本作为训练集，剩余作为测试集，我的思想是，将样本随机打乱，然后取出前面一部分的样本作为训练集，后面一部分成为测试集，下面是我的代码：
def hold_out(sampleNum_1,sampleNum_2,ratio,seed): #传入样本的总个数
np.random.seed(seed) #设置下标打乱的随机种子
idx_1 = np.arange(0, sampleNum_1)

np.random.shuffle(idx_1)

trainNum_1 = int(sampleNum_1*ratio) #样本总个数*0.8取整数训练样本数

trainIndex_1 = []
testIndex_1 = []
i = 0
for item in idx_1:

    if(i<trainNum_1):
        trainIndex_1.append(item)
    else:
        testIndex_1.append(item)

    i = i+1


idx_2 = np.arange(0, sampleNum_2)
np.random.shuffle(idx_2)
trainNum_2 = int(sampleNum_2*ratio)  #样本总个数*0.8取整数 训练样本数

trainIndex_2 = []
testIndex_2 = []
i = 0
for item in idx_2:

    if(i<trainNum_2):
        trainIndex_2.append(item+sampleNum_1)
    else:
        testIndex_2.append(item+sampleNum_1)

    i = i+1

trainIndex = trainIndex_1+trainIndex_2
testIndex = testIndex_1 + testIndex_2

return trainIndex,testIndex

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2020-02-27 10:57
关注
这两者完全等价。
本质上 np.random.shuffle 这个算法就是从原始数组中随机取全部的元素，构成新序列。所以你从10个人里面随机抽取8个人只是做了这个算法的前面一部分而已。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

0<x<10可以完全等价于0<x&&x<10吗 c语言
2022-03-10 20:36

回答 1 已采纳因为C语言不能连续判断0<x<10和0<x&&x<10在数学上一值，但是前者在C语言中不允许
pta 里面的 sample等价中答案错误是什么意思？ c语言
2023-01-17 16:27

回答 1 已采纳 sample等价，字面意思，就是跟题目里给的例子一模一样答案错误就是你print的内容和要求的不一致呗那到底为什么不一致，你需要把完整题目和完整代码放出来要不然别人也不好猜你这里到底哪里不对
D选项是什么，有人知道吗？与什么等价？ c语言
2022-11-01 11:26

回答 2 已采纳 a!^=b这个表达式不对，应该是a!=b和a=a!b不等价，!不是运算符
java个人整理知识点
2021-12-15 19:48

闲落~的博客 = 从左到右 & 从左到右 ^ 从左到右 | 从左到右 && 从左到右 || 从左到右 ?: 从右到左 = 从右到左流程控制： if语句： if(){} if else if else if else switch case...
++2与3等价吗？（int）1.0/3与1/3等价吗？ c语言
2021-12-18 15:15

回答 1 已采纳如果是做输出的话输出的结果是一样的但是要说等价可能有点牵强
全色图像等价于灰度图吗？深度学习目标检测计算机视觉
2022-08-31 14:34

回答 1 已采纳看你检测的目标情况，有些可以有些不行的。举个简单的例子，红绿灯检测，没了颜色信息就gg了。
*（a）不是等价与a［0］吗？ c++ 有问必答
2021-11-28 22:43

回答 3 已采纳因为string a 声明的是一个string对象不是一个单纯的字符数组或指针。string类，只重载了[]符，但没有重载*符
总结个人版
2021-11-16 08:51

一只小狍子的博客面向过程会将任务拆解成一系列的步骤（函数），1、打开洗衣机----->2、放衣服----->3、放洗衣粉----- >4、清洗----->5、烘干面向对象会拆出人和洗衣机两个对象：人：打开洗衣机放衣服放洗衣粉 ...
请问sample等价是什么错误，为什么这个程序只有部分错误？？ c语言
2021-07-10 23:25

回答 1 已采纳数据类型问题，传入/传出的应该是double类型，你return了int
以下哪个循环和其他三条循环不等价（假设循环体都是一样的）？ c语言
2022-08-16 15:44

回答 5 已采纳 CA,B,D结束时，i值都为10；C结束时，i值为11或者说A，B，D都是循环结束后i才加1C是循环开始时i就加1了比如代码块是：for(int i=0;i++<10;){ printf(
为什么a[0]和*(a+0)等价？ c++ c语言
2022-03-05 15:24

回答 2 已采纳 a[0]是作为二维数组首元素的一维数组名，所以a[0]表示一维数组（实际是二维数组首行）首元素的地址，即，a[0]是a[0][0]的地址；数组名a是指针，指向其首元素（a[0]），即其值为&a[0]（
Mybatis学习总结(结合个人理解)
2021-06-16 16:34

|Mark|的博客 MyBatis 可以使用简单的 XML 或注解来配置和映射原生信息，将接口和 Java 的实体类【Plain Old Java Objects,普通的 Java对象】映射成数据库中的记录。 MyBatis 本是apache的一个开源项目ibatis, 2010年这个项目由...
为什么!(a&&b)与!a||!b等价啊? c语言
2022-12-12 00:51

回答 1 已采纳 &&取反就是||，因此，去掉括号之后就是!a || !b。如果还不理解，可以列个真值表比较，最后发现他们的真值表结果是一样的
数据分析个人笔记
2020-06-18 15:06

阳阳7的博客方法如下： numpy.arange(start, stop, step, dtype=None) 你需要先设置值所在的区间，这里为 ``[开始，停止），你应该能发现这是一个半开半闭区间。然后，在设置step步长用于设置值之间的间隔。最后的可选参数...
这一年，这些书：2022年读书笔记
2022-12-31 17:50

Heartsuit的博客 Note: 以下 `markdown` 格式文本由 `json2md` 自动转换生成，可参考[JSON转Markdown：我把阅读数据从MongoDB中导出转换为.md了](https://blog.csdn.net/u013810234/article/details/113360229)了解具体的转换过程。...
没有解决我的问题, 去提问

悬赏问题

¥15 用hfss做微带贴片阵列天线的时候分析设置有问题
¥50 我撰写的python爬虫爬不了要爬的网址有反爬机制
¥15 Centos / PETSc / PETGEM
¥15 centos7.9 IPv6端口telnet和端口监控问题
¥120 计算机网络的新校区组网设计
¥20 完全没有学习过GAN，看了CSDN的一篇文章，里面有代码但是完全不知道如何操作
¥15 使用ue5插件narrative时如何切换关卡也保存叙事任务记录
¥20 海浪数据南海地区海况数据，波浪数据
¥20 软件测试决策法疑问求解答
¥15 win11 23H2删除推荐的项目，支持注册表等

从10个人里面随机抽取8个人，跟先将10个人随机排列，再取出前8个人，这两者等价吗？（机器学习hold_out实现）

1条回答 默认 最新

悬赏问题

1条回答默认最新