m0_59740969 2021-06-27 15:35 采纳率: 100%
浏览 269
已采纳

泰坦尼克号生存数据分析

对数据进行如下操作:

1.导入必要的库和csv格式的数据文件(titanic数据)

2按性别处理数据中年龄的缺失值(用合适数值填充)

3通过查看极值和分箱,探索数据中有没有异常值,有异常值则进行处理(用合适数值填充)

4.练习设置分层索引并进行拆堆和堆叠操作

5.按照乘客等级分组,聚合输出各乘客等级的乘客的平均年龄,查看各乘客等级的乘客的生存率

6.按照性别分组,聚合输出各性别的乘客的平均生存率

7.按照乘客等级和性别分组,聚合输出交叉维度的平均生存率,中位数

8.按照客舱进行分组,输出每组5个年龄最小的乘客

9.分别输出以上5-7的bar图,根据实际情况决定水平或堆叠,需要包括title、legend、grid、xtick ytick等元素,需要有图和子图,以及子图之间的对比关系,体现共享x或y轴。

10.选择3-5个pandas的函数或方法,练习其他操作的内容

  • 写回答

1条回答 默认 最新

  • 关注

    可以参考这篇文章,希望对你有帮助:第2次作业-titanic数据集练习 - 张晓悦 - 博客园 (cnblogs.com)

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

悬赏问题

  • ¥20 怎么用dlib库的算法识别小麦病虫害
  • ¥15 华为ensp模拟器中S5700交换机在配置过程中老是反复重启
  • ¥15 java写代码遇到问题,求帮助
  • ¥15 uniapp uview http 如何实现统一的请求异常信息提示?
  • ¥15 有了解d3和topogram.js库的吗?有偿请教
  • ¥100 任意维数的K均值聚类
  • ¥15 stamps做sbas-insar,时序沉降图怎么画
  • ¥15 买了个传感器,根据商家发的代码和步骤使用但是代码报错了不会改,有没有人可以看看
  • ¥15 关于#Java#的问题,如何解决?
  • ¥15 加热介质是液体,换热器壳侧导热系数和总的导热系数怎么算