Edamame0526 2022-11-27 19:07 采纳率: 0%
浏览 48
已结题

关于#pandas#的问题,如何解决?(语言-python)

目前已知一个购物清单,原题目如下
交易数据集;每行数据代表一个用户购物的交易记录;共计1万条记录。1代表对应物品被购买,0代表没有购买。
请使用pandas将数据导入为dataframe,物品名作为列名。
请统计各个物品被购买的情况,给出对应各个物品被购买的基本统计数据,并进行对比。对所有物品进行统计分析,包括min/max/Q1/Q3 和中位数,并绘制盒图等多个统计图进行对比。
此外,请统计超市中每笔交易购买物品的情况,使用相似的分析思路进行对比。
删除购置物品最少的2000笔交易记录,将剩余的数据导出为csv格式。与对应的notebook文件压缩后一同上传。

img


请问应当如何用pandas和numpy统计每一列数据之后再进行绘图,并且如何删除最少的2000笔交易记录

  • 写回答

9条回答 默认 最新

  • 一切因为有你 2022-11-28 21:08
    关注
    获得1.60元问题酬金

    ###按着你的题目写的简易的

    
    import pandas as pd
    import matplotlib.pyplot as plt
    path1='D:/ZZF/data.xlsx' ##你的文件路径
    
    df1=pd.read_excel(path1) ##读入数据,以第一行商品维列名
    
    print(df1.describe()) ##打印出每个商品的最大最小,分位数,中位数等
    
    fig = plt.figure() 
    plt.boxplot(df1) ##盒图
    plt.show()
    
    df1['sum']=df1.sum(axis=1) ##统计每笔交易的购买数量
    
    fig = plt.figure() 
    plt.hist(df1) ##柱状图
    plt.show()
    
    df2=df1.sort_values(by='sm',ascending=0) ##按数量排序
    df3=df2.head(len(df2)-2000)  ##剔除后两千条
    df3.to_excel('data2.xlsx',index=0) ##导出数据
    
    
    评论

报告相同问题?

问题事件

  • 系统已结题 12月5日
  • 创建了问题 11月27日

悬赏问题

  • ¥15 c程序不知道为什么得不到结果
  • ¥40 复杂的限制性的商函数处理
  • ¥15 程序不包含适用于入口点的静态Main方法
  • ¥15 素材场景中光线烘焙后灯光失效
  • ¥15 请教一下各位,为什么我这个没有实现模拟点击
  • ¥15 执行 virtuoso 命令后,界面没有,cadence 启动不起来
  • ¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
  • ¥20 有关区间dp的问题求解
  • ¥15 多电路系统共用电源的串扰问题
  • ¥15 slam rangenet++配置