m0_71065436 2022-05-22 22:54 采纳率: 100%
浏览 109
已结题

这个可以怎么做呀 可以解答一下吗

python分层抽样
任务四:根据Survived字段的取值抽取数据
Survived= 1的记录中随机抽取300条数据,Survived=0的记录中随机抽取100条数据, 最终形成400条记录的数据集。
任务五:筛选票价高于30的数据,最终保留抽取男女各占-半的数据

img

  • 写回答

2条回答 默认 最新

  • 牧子川 2022-05-23 17:21
    关注
    
    import pandas as pd
    
    
    def task_4(data):
        """
        :param data:是将数据处理好后的结果,我猜测你的数据应该是泰坦尼克人员幸存,数据类型应该是dataframe形式的
        :return:400条Survived数据
        """
        # 找到所有的Survived字段
        Survived_1 = data.loc[data['Survived'] == 1]
        Survived_0 = data.loc[data['Survived'] == 0]
        # 随机抽样
        Survived_300 = Survived_1.sample(n=300, random_state=1, axis=0)
        Survived_100 = Survived_0.sample(n=100, random_state=1, axis=0)
        # 将抽样的样本进行拼接
        new_Survived = pd.concat([Survived_300, Survived_100])
        return new_Survived
    
    
    def task_5(data):
        """
        :param data: 将数据处理好后的结果
        :return:
        """
        # 选取票价大于30的行
        ticket = data.query("Ticket > 30")
        # 从中选出男性和女性
        ticket_male = data.loc[ticket['sex'] == "male"]
        ticket_female = data.loc[ticket['sex'] == "female"]
        # 在男性和女性中随机选出一半人数
        ticket_male_half = ticket_male.sample(frac=0.5, replace=True, random_state=1)
        ticket_female_half = ticket_female.sample(frac=0.5, replace=True, random_state=1)
        # 将选出的人数进行拼接
        new_ticket = pd.concat([ticket_male_half, ticket_female_half])
        return new_ticket
    ```python
    
    
    

    ```

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 6月1日
  • 已采纳回答 5月24日
  • 创建了问题 5月22日

悬赏问题

  • ¥15 完成下列问题完成下列问题
  • ¥15 C#算法问题, 不知道怎么处理这个数据的转换
  • ¥15 YoloV5 第三方库的版本对照问题
  • ¥15 请完成下列相关问题!
  • ¥15 drone 推送镜像时候 purge: true 推送完毕后没有删除对应的镜像,手动拷贝到服务器执行结果正确在样才能让指令自动执行成功删除对应镜像,如何解决?
  • ¥15 求daily translation(DT)偏差订正方法的代码
  • ¥15 js调用html页面需要隐藏某个按钮
  • ¥15 ads仿真结果在圆图上是怎么读数的
  • ¥20 Cotex M3的调试和程序执行方式是什么样的?
  • ¥20 java项目连接sqlserver时报ssl相关错误