问题：np.random.sample和choice在随机抽样时有何区别？

问题：在使用 NumPy 进行随机抽样时，`np.random.sample` 和 `np.random.choice` 都可以生成随机样本，但它们在功能和使用场景上有何关键区别？特别是在抽样方式、输入参数、是否支持重复抽样以及概率权重设置等方面有何不同？如何根据实际需求选择合适的方法？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

ScandalRafflesia 2025-07-16 06:30

关注

一、引言：NumPy 随机抽样方法的常见应用场景

在数据分析和机器学习项目中，随机抽样是常用的技术手段。NumPy 提供了多种随机抽样函数，其中 np.random.sample 和 np.random.choice 是两个常用的函数。尽管它们都能生成随机样本，但在功能和使用场景上有显著区别。

理解这些差异有助于我们更有效地选择合适的方法来满足具体需求，例如是否需要从已有数据中抽样、是否允许重复、是否需要自定义概率分布等。

二、基本概念与函数介绍

np.random.sample(size=None)：返回 [0.0, 1.0) 区间内的浮点数样本，基于均匀分布。
np.random.choice(a, size=None, replace=True, p=None)：从给定的一维数组 a 中进行有放回或无放回的抽样，支持指定概率权重。

三、核心区别分析

特性	np.random.sample	np.random.choice
抽样方式	从[0.0, 1.0)区间连续均匀分布中抽样	从输入数组中离散抽样
输入参数	仅接受输出形状 size	接受待抽样的数组 a、输出形状 size、是否放回 replace、概率分布 p
是否支持重复抽样	不适用（生成的是浮点数）	可通过 replace 参数控制
是否支持概率权重	不支持	支持通过 p 参数设置概率分布
典型使用场景	生成随机浮点数用于模拟、初始化等	从已有数据中按概率抽样，如重采样、模拟抽奖等

四、代码示例对比

# 示例1：np.random.sample
import numpy as np

# 生成一个包含5个浮点数的数组
sample_data = np.random.sample(5)
print(sample_data)

# 示例2：np.random.choice
choices = ['A', 'B', 'C']
weights = [0.1, 0.3, 0.6]

# 从choices中抽取3个元素，允许重复，按weights概率分布
choice_data = np.random.choice(choices, size=3, replace=True, p=weights)
print(choice_data)

五、流程图：如何选择 sample 还是 choice？

graph TD A[你的目标是什么？] --> B{是否需要从已有数据中抽样？} B -- 是 --> C[是否需要设置概率权重？] C -- 是 --> D[np.random.choice] C -- 否 --> E[np.random.choice (默认均匀)] B -- 否 --> F[是否需要生成[0,1)之间的浮点数？] F -- 是 --> G[np.random.sample] F -- 否 --> H[考虑其他随机函数]

六、实际应用案例分析

假设我们要模拟一个电商网站用户的点击行为：

如果想模拟用户点击页面的时间间隔（浮点型），可以使用 np.random.sample。
如果要从商品类别中根据历史点击率进行抽样，则应使用 np.random.choice 并传入对应的概率权重。

再比如，在交叉验证中进行样本划分时，若需从原始数据集中按比例抽样并允许重复（Bootstrap 方法），则 np.random.choice 更为合适。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

报告相同问题？

关注问题

(如何从一个列表中随机抽样）np.random.choice(),random.sample()
2021-09-12 16:08

音程的博客这个函数非常有用，可以从一个列表中抽样。其一共有4个参数： choice(a, size=None, replace=True, p=None) a :列表或者整数若为整数，则等价于一个列表，因为函数会自动先把整数a变成列表np.arange(a) 总之，...
2025——》NumPy中的np.random.randint使用/在什么场景下适合使用np.random.randint？NumPy随机整数生成全攻略
2025-05-28 19:08

明—猿的博客 NumPy的np.random.randint函数用于生成指定范围的随机整数，基本语法为np.random.randint(low, high=None, size=None, dtype=int)。该函数支持生成单个随机数或任意形状的数组，并可指定数据类型。适用于随机采样、...
np.random.randint、np.random.choice、random.sample三种随机函数的用法案例
2018-07-04 21:18

Ethan的博客的博客一、np.random.randintimport numpy as np y1=np.random.randint(2,10,(3,2)) print(y1)输出: ... [6, 4]])解释：生成3行2列的数组，取值范围[2,10)之间二、np.random.choiceimport numpy as np a1=np.ar...
Python随机抽样实战：random.choices()和random.sample()到底怎么选？
2026-03-06 00:23

Ais_ha_9的博客本文深入解析Python中random.choices()与random.sample()的核心区别与应用场景。random.sample()执行无放回抽样，确保结果不重复，适用于数据分割、公平抽奖等场景。random.choices()执行有放回抽样，支持权重参数，...
numpy:np.random.choice()理解
2020-02-27 12:16

阿拉祖的博客拜读了这篇文章对np.random.choice()有所了解.本文部分引自这篇文章. https://blog.csdn.net/wyx100/article/details/80639653?depth_1-utm_source=distribute.pc_relevant.none-task&utm_source=distribute.pc_...
关于np.random.choice(50, num_peaks, replace=False)的使用场景总结
2025-12-30 17:10

月疯的博客测试：np.random.choice(50, num_peaks, replace=False) 重要限制和错误场景1：随机分割数据集场景2：峰值检测应用场景3：随机抽样调查模拟 6. 概率分布控制 7. 替代方案对比 8. 高级...
numpy抽样函数 np.random.choice用法详解
2022-05-21 21:00

低调流年的微凉的博客顾名思义，抽样函数，定义如下： def choice(a, size=None, replace=True, p=None): 参数说明： a :待抽样的样本（一维数组或整数） size: 输出大小，默认返回单个元素 replace : 抽样后的元素是否可重复，默认...
numpy学习笔记——np.random.choice(),np.random.randint(),mrandom.sample()
2021-11-06 16:20

phily123的博客添加链接描述添加链接描述
python，numpy中np.random.choice()的用法详解及其参考代码
2019-07-17 10:59

ImwaterP的博客处理数据时经常需要从数组中随机抽取元素，这时候就需要用到np.random.choice()。然而choice用法的官方解释并不详细，尤其是对replace参数的解释，例子也不是很全面。因此经过反复实验，我较为详细的总结出了他的...
Python常用函数：random【random.random、random.randint、random.choice、random.sample、random.shuffle】
2022-04-03 22:38

u013250861的博客一、random.random()：从0~1之间随机生成一个随机数二、random.randint(int,int)：从2个int之间随机...四、random.sample(list,int)：从数组元素中随机抽样int个五、random.shuffle(list)：将数组元素顺序打乱 ...
np.random.choice方法
2018-11-08 19:09

武科大许志伟的博客 np.random.choice方法觉得有用的话,欢迎一起讨论相互学习~Follow Me def choice(a, size=None, replace=True, p=None) 表示从a中随机选取size个数 replacement 代表的意思是抽样之后还放不放回去，如果是False的...
随机操作——python的random库和np.random
2022-04-02 17:24

卡卡西~的博客 1python自带的random库随机生成一个n-m之间的整数： random.randint(1,10) 随机生成一个浮点数： random.random()，什么参数都不需要给，随机生成一个0到1...random.choice(‘tomorrow’)，随机从该字符串中选择一个
python中随机选取元素 random.sample 和 np.random.choice()
2019-01-08 13:57

贝猫说python的博客 python中random.sample()方法可以随机地从指定列表中提取出N个不同的元素，但在实践中发现，当N的值比较大的时候，该方法执行速度很慢，如： numpy random模块中的choice方法可以有效提升随机提取的效率：需要...
random.sample 函数详解
2024-10-25 17:03

猫敷雪的博客是一个非常实用的函数，适用于多种数据类型的无放回随机采样。无论是处理小规模数据，还是需要在大规模数据集上抽样分析，都可以利用来实现。在数据科学、游戏开发以及抽奖系统等多种领域，都是一个不可或缺的工具。...
python 抽样函数 random.choices() 和random.sample()的区别
2024-02-28 10:39

没有人比我更懂暴力算法的博客结论：从速度上看，当抽样数量小的时候，random.sample方法比numpy.random.choice方法快很多；当抽样数量很大的时候，random.sample方法就不如numpy.random.choice方法。原文链接：...
Numpy | np.random随机模块的使用介绍
2022-05-11 12:15

Clichong的博客平时都会使用到随机模块，一般是torch.random或者是numpy.random，有或者是直接使用ramdom这个python内置的工具包，那么下面就简单记录一下numpy.random常用的函数。 1. 随机抽样 import numpy as np np.random....
基于Python中random.sample()的替代方案
2020-09-16 20:01

在Python编程语言中，`random.sample()`是一个非常实用的函数，用于从指定的列表或序列中随机抽取不重复的元素。然而，在某些情况下，特别是当需要抽取的元素数量较大时，该函数的性能可能会变得不够理想。本文将...
【Numpy】np.random.choice方法
2019-09-26 11:22

mjiansun的博客 replacement 代表的意思是抽样之后还放不放回去，如果是False的话，那么通一次挑选出来的数都不一样，如果是True的话，有可能会出现重复的，因为前面的抽的放回去了。 p表示每个元素被抽取的概率，如果没有指定...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 10月23日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月16日