m0_59740969 2021-06-27 15:35 采纳率: 100%
浏览 272
已采纳

泰坦尼克号生存数据分析

对数据进行如下操作:

1.导入必要的库和csv格式的数据文件(titanic数据)

2按性别处理数据中年龄的缺失值(用合适数值填充)

3通过查看极值和分箱,探索数据中有没有异常值,有异常值则进行处理(用合适数值填充)

4.练习设置分层索引并进行拆堆和堆叠操作

5.按照乘客等级分组,聚合输出各乘客等级的乘客的平均年龄,查看各乘客等级的乘客的生存率

6.按照性别分组,聚合输出各性别的乘客的平均生存率

7.按照乘客等级和性别分组,聚合输出交叉维度的平均生存率,中位数

8.按照客舱进行分组,输出每组5个年龄最小的乘客

9.分别输出以上5-7的bar图,根据实际情况决定水平或堆叠,需要包括title、legend、grid、xtick ytick等元素,需要有图和子图,以及子图之间的对比关系,体现共享x或y轴。

10.选择3-5个pandas的函数或方法,练习其他操作的内容

  • 写回答

1条回答 默认 最新

  • 关注

    可以参考这篇文章,希望对你有帮助:第2次作业-titanic数据集练习 - 张晓悦 - 博客园 (cnblogs.com)

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

悬赏问题

  • ¥15 用twincat控制!
  • ¥15 请问一下这个运行结果是怎么来的
  • ¥15 单通道放大电路的工作原理
  • ¥30 YOLO检测微调结果p为1
  • ¥20 求快手直播间榜单匿名采集ID用户名简单能学会的
  • ¥15 DS18B20内部ADC模数转换器
  • ¥15 做个有关计算的小程序
  • ¥15 如何用MATLAB实现以下三个公式(有相互嵌套)
  • ¥30 关于#算法#的问题:运用EViews第九版本进行一系列计量经济学的时间数列数据回归分析预测问题 求各位帮我解答一下
  • ¥15 setInterval 页面闪烁,怎么解决