df4 = pd.read_excel(
io='model.xls',
skiprows=lambda x: x > 0 and random() > 0.1
)
skiprows=lambda x: x > 0 and random() > 0.1不理解,为什么它能够达到读取 Excel 文件的表头和其中10%的数据的目的?,什么传给了匿名函数的参数x?
我的理解不是很透彻,如果问的有问题,也欢迎指正。谢谢解答!
df4 = pd.read_excel(
io='model.xls',
skiprows=lambda x: x > 0 and random() > 0.1
)
skiprows=lambda x: x > 0 and random() > 0.1不理解,为什么它能够达到读取 Excel 文件的表头和其中10%的数据的目的?,什么传给了匿名函数的参数x?
我的理解不是很透彻,如果问的有问题,也欢迎指正。谢谢解答!
通过匿名函数指定跳过索引大于0的行,即只取首行,90%的数据被随机过滤掉,参数x为行索引。参考一下这里的解释:
https://www.cnblogs.com/gczr/p/11349126.html