目前已知一个购物清单,原题目如下
交易数据集;每行数据代表一个用户购物的交易记录;共计1万条记录。1代表对应物品被购买,0代表没有购买。
请使用pandas将数据导入为dataframe,物品名作为列名。
请统计各个物品被购买的情况,给出对应各个物品被购买的基本统计数据,并进行对比。对所有物品进行统计分析,包括min/max/Q1/Q3 和中位数,并绘制盒图等多个统计图进行对比。
此外,请统计超市中每笔交易购买物品的情况,使用相似的分析思路进行对比。
删除购置物品最少的2000笔交易记录,将剩余的数据导出为csv格式。与对应的notebook文件压缩后一同上传。
请问应当如何用pandas和numpy统计每一列数据之后再进行绘图,并且如何删除最少的2000笔交易记录