EGFERH 2020-11-01 15:47 采纳率: 0%
浏览 297

如何用python处理数值型数据?

实验二 用python处理数值型数据(必做)

实验目的:熟悉python的基本数据结构,以及文件的输入与输出。

实验环境:anaconda3

实验数据:

2016年阿里天池大赛,也是中国高校第一届大数据挑战赛的数据。

数据包括两个表,分别是

用户行为表mars-tianchi-user-actions.csv。

歌曲艺人表mars-tianchi-songs.csv。

图片说明

图片说明

实验内容:

1。对歌曲艺人数据mars-tianchi-songs进行处理,统计出艺人的个数以及每个艺人的歌曲数量。输出文件格式为exp2-1.csv,第一列为艺人的ID,第二列为该艺人的歌曲数目。最后一行输出艺人的个数。

2。将用户行为表和歌曲艺人表以歌曲song-id作为关联,合并为一个大表。各列名称为第一到第五列与用户行为表的列名一致,第六到第十列为歌曲艺人表中的第二列到第六列的列名。输出文件名为exp2-2.csv。

3。按照艺人统计每个艺人每天所有歌曲的播放量,输出文件为exp2-3.csv,各个列名为艺人id,日期Ds,歌曲播放总量。注意:这里只统计歌曲的播放量,不包括下载和收藏的数量。要求输出格式
图片说明

  • 写回答

2条回答 默认 最新

  • 小白白的自学之路 2022-04-21 18:18
    关注

    同学做出来了吗

    评论

报告相同问题?

悬赏问题

  • ¥15 高德地图点聚合中Marker的位置无法实时更新
  • ¥15 DIFY API Endpoint 问题。
  • ¥20 sub地址DHCP问题
  • ¥15 delta降尺度计算的一些细节,有偿
  • ¥15 Arduino红外遥控代码有问题
  • ¥15 数值计算离散正交多项式
  • ¥30 数值计算均差系数编程
  • ¥15 redis-full-check比较 两个集群的数据出错
  • ¥15 Matlab编程问题
  • ¥15 训练的多模态特征融合模型准确度很低怎么办