m0_59740969 2021-06-27 15:35 采纳率: 100%
浏览 269
已采纳

泰坦尼克号生存数据分析

对数据进行如下操作:

1.导入必要的库和csv格式的数据文件(titanic数据)

2按性别处理数据中年龄的缺失值(用合适数值填充)

3通过查看极值和分箱,探索数据中有没有异常值,有异常值则进行处理(用合适数值填充)

4.练习设置分层索引并进行拆堆和堆叠操作

5.按照乘客等级分组,聚合输出各乘客等级的乘客的平均年龄,查看各乘客等级的乘客的生存率

6.按照性别分组,聚合输出各性别的乘客的平均生存率

7.按照乘客等级和性别分组,聚合输出交叉维度的平均生存率,中位数

8.按照客舱进行分组,输出每组5个年龄最小的乘客

9.分别输出以上5-7的bar图,根据实际情况决定水平或堆叠,需要包括title、legend、grid、xtick ytick等元素,需要有图和子图,以及子图之间的对比关系,体现共享x或y轴。

10.选择3-5个pandas的函数或方法,练习其他操作的内容

  • 写回答

1条回答 默认 最新

  • 关注

    可以参考这篇文章,希望对你有帮助:第2次作业-titanic数据集练习 - 张晓悦 - 博客园 (cnblogs.com)

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

悬赏问题

  • ¥15 java 操作 elasticsearch 8.1 实现 索引的重建
  • ¥15 数据可视化Python
  • ¥15 要给毕业设计添加扫码登录的功能!!有偿
  • ¥15 kafka 分区副本增加会导致消息丢失或者不可用吗?
  • ¥15 微信公众号自制会员卡没有收款渠道啊
  • ¥15 stable diffusion
  • ¥100 Jenkins自动化部署—悬赏100元
  • ¥15 关于#python#的问题:求帮写python代码
  • ¥20 MATLAB画图图形出现上下震荡的线条
  • ¥15 关于#windows#的问题:怎么用WIN 11系统的电脑 克隆WIN NT3.51-4.0系统的硬盘