python分层抽样
任务四:根据Survived字段的取值抽取数据
Survived= 1的记录中随机抽取300条数据,Survived=0的记录中随机抽取100条数据, 最终形成400条记录的数据集。
任务五:筛选票价高于30的数据,最终保留抽取男女各占-半的数据
这个可以怎么做呀 可以解答一下吗
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
2条回答 默认 最新
- 牧子川 2022-05-23 17:21关注
import pandas as pd def task_4(data): """ :param data:是将数据处理好后的结果,我猜测你的数据应该是泰坦尼克人员幸存,数据类型应该是dataframe形式的 :return:400条Survived数据 """ # 找到所有的Survived字段 Survived_1 = data.loc[data['Survived'] == 1] Survived_0 = data.loc[data['Survived'] == 0] # 随机抽样 Survived_300 = Survived_1.sample(n=300, random_state=1, axis=0) Survived_100 = Survived_0.sample(n=100, random_state=1, axis=0) # 将抽样的样本进行拼接 new_Survived = pd.concat([Survived_300, Survived_100]) return new_Survived def task_5(data): """ :param data: 将数据处理好后的结果 :return: """ # 选取票价大于30的行 ticket = data.query("Ticket > 30") # 从中选出男性和女性 ticket_male = data.loc[ticket['sex'] == "male"] ticket_female = data.loc[ticket['sex'] == "female"] # 在男性和女性中随机选出一半人数 ticket_male_half = ticket_male.sample(frac=0.5, replace=True, random_state=1) ticket_female_half = ticket_female.sample(frac=0.5, replace=True, random_state=1) # 将选出的人数进行拼接 new_ticket = pd.concat([ticket_male_half, ticket_female_half]) return new_ticket ```python
```
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报
悬赏问题
- ¥15 完成下列问题完成下列问题
- ¥15 C#算法问题, 不知道怎么处理这个数据的转换
- ¥15 YoloV5 第三方库的版本对照问题
- ¥15 请完成下列相关问题!
- ¥15 drone 推送镜像时候 purge: true 推送完毕后没有删除对应的镜像,手动拷贝到服务器执行结果正确在样才能让指令自动执行成功删除对应镜像,如何解决?
- ¥15 求daily translation(DT)偏差订正方法的代码
- ¥15 js调用html页面需要隐藏某个按钮
- ¥15 ads仿真结果在圆图上是怎么读数的
- ¥20 Cotex M3的调试和程序执行方式是什么样的?
- ¥20 java项目连接sqlserver时报ssl相关错误