weixin_63828581 2021-12-29 12:41 采纳率: 100%
浏览 29
已结题

数据的提取,画图这些还要用包,可以解决一下么

img

img

文件夹中的数据文件 kzpart.csv 包含有2020年10月用户从大型家用电器和电子产品在线商店的购买数据

数据各字段含义如下:

  • event_time -事件发生时间
  • product_id -产品编号
  • category_id -产品的类别ID
  • category_code -产品的类别代码(代码名称)
  • brand -品牌名称
  • price -产品价格
  • user_id -用户ID

尝试完成以下分析,并解释分析结果

  1. 用户消费金额、消费次数的描述性统计
  2. 用户消费次数、消费金额散点图
  3. 用户消费金额分布图
  4. 用户消费次数分布图
  5. 用户累计消费金额占比

在代码注释中清晰说明分析步骤[

  • 写回答

1条回答 默认 最新

  • 陈年椰子 2022-01-01 10:43
    关注

    给个建议, 用pandas + matplotlib 解决
    1.用户消费金额、消费次数的描述性统计 这个用 group by userid , 形成一个列表
    2.用户消费次数、消费金额散点图 matplotlib 的 scatter
    3.用户消费金额分布图 在1 的结果基础上 group by sum_price 直方图
    4.用户消费次数分布图 在1 的结果 基础上group by 次数 直方图
    5.用户累计消费金额占比 在3的基础上画饼图

    另外, 那个CSV文件不要用excel 打开, 因为product_id,user_id 是全数字,用ue 或者 notepad++ 之类的打开看。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 6月16日
  • 已采纳回答 6月8日
  • 创建了问题 12月29日

悬赏问题

  • ¥66 换电脑后应用程序报错
  • ¥50 array数据同步问题
  • ¥15 pic16F877a单片机的外部触发中断程序仿真失效
  • ¥15 Matlab插值拟合差分微分规划图论
  • ¥15 keil5 target not created
  • ¥15 C/C++数据与算法请教
  • ¥15 怎么找志同道合的伙伴
  • ¥20 如何让程序ab.eXe自已删除干净硬盘里的本文件自己的ab.eXe文件
  • ¥50 爬虫预算充足,跪巨佬
  • ¥15 滑块验证码拖动问题悬赏