热情的颓废者 2024-05-27 10:26 采纳率: 63.3%
浏览 62

将超市销售excel文件根据商品的类别筛选存储

任务描述
本关任务:
超市销售数据如图所示

img

建立excel 文件“类别销售”,根据不同类别建立多个工作表,将相同类别的销售信息存放在相应的工作表中。

img

相关知识
为了完成本关任务,你需要掌握:1.读取 excel 文件;2.筛选 dataframe 数据;3.将数据写入工作簿和工作表。

从 excel 文件读入数据

pd.read_excel(filename,sheet_name=0,header=0,index_col=None,names=None,dtype=None)

filename:指定电子表格的具体路径
sheet_name:指定需要读取电子表格中的第几个 sheet,既可以传递整数也可以传递具体的 Sheet 名称
header:是否需要将数据集的第一行用作表头,默认为是需要的
index_col:指定哪些列用作数据框的行索引(标签)
names:如果原数据集中没有字段,可以通过该参数在数据读取时给数据框添加具体的表头
dtypes:通过字典的形式,指定某些列需要转换的形式

向 excel 文件写入数据

DataFrame.to_excel(excel_writer, sheet_name='Sheet1', na_rep='',
 float_format=None, columns=None, header=True, index=True, 
 index_label=None, encoding=None)

excel_writer: 文件路径或现有的 ExcelWriter。
sheet_name:字符串,表的名称。默认“Sheet1”。
na_rep: 字符串,默认‘ ’,缺失数据表示方式。
float_format: 字符串,默认None,格式化浮点数的字符串。
columns : 列表,要写入的列。
header: 布尔或字符串列表,默认为Ture。如果给定字符串列表,则它是列名。
index:布尔,默认的Ture,行名(索引)。
index_label: 字符串或序列,默认为None。
注意:通过 ExcelWriter 写入后要同执行save()保存。

DataFrame
唯一值函数
unique()是以数组形式返回列的所有唯一值

筛选数据
Pandas 的 .loc 参数可以对多列数据进行筛选,并且支持不同筛选条件逻辑组合。
常用的筛选条件包括等于(==),不等于(!),大于(>),小于(<),大于等于(>=) ,小于等于(<=)等等。逻辑组合包括与(&)和或(|)。

list1=[["张三",'男'],["李四",'女'],["王五",'男'],["赵六",'女']]
import panda as pd
df=pd.DataFrame(list1,columns=["姓名","性别"])

则 df
姓名 性别
0 张三 男
1 李四 女
2 王五 男
3 赵六 女

df["性别"].unique()

“男”,"女"

df.loc[df["性别"]=="男"]

姓名 性别
0 张三 男
2 王五 男

编程要求
根据提示,在右侧编辑器补充代码,建立 excel 文件“类别销售”,根据不同类别建立多个工作表,将相同类别的销售信息存放在相应的工作表中。

测试说明
平台会对你编写的代码进行测试:
输入类别,系统将显示该类别工作表的日期,商品编码,商品名称和合计金额四列信息

测试输入:调料;
预期输出:
日期 商品编码 商品名称 合计金额
0 2000-05-30 \t090202010048 \t裕荣虾味先虾条(原味)80g 7.7
1 2000-06-22 \t090202010071 \t四季宝颗粒花生酱340g 13.3
2 2000-06-24 \t090202010035 \t牛头牌鸡汤块66g 7.7
3 2000-07-18 \t090202010024 \t金兰拌面拌饭酱370g 20.4

测试输入:电池;
预期输出:
日期 商品编码 商品名称 合计金额
0 2000-06-14 \t010105010002 \t金霸王7号2粒 5.2
1 2000-06-14 \t010105010005 \t金霸王超能量(m3)7号2粒 6.2
2 2000-07-16 \t010105010007 \t南孚电池7号5粒装 8.9
以下是已经给出的代码:

import pandas as pd
df = pd.read_excel("slscl/step1/超市销售数据.xlsx",dtype={"商品编码":str,"商品条码":str})
writer = pd.ExcelWriter("slscl/step1/类别销售.xlsx")
#代码开始

#代码结束
  • 写回答

1条回答 默认 最新

  • 阿里嘎多学长 2024-05-27 10:26
    关注

    以下内容由CHATGPT及阿里嘎多学长共同生成、有用望采纳:


    根据你提供的任务描述和代码框架,我将帮你完成这个任务。以下是完整的Python代码实现:

    import pandas as pd
    
    # 读取原始Excel文件中的超市销售数据
    df = pd.read_excel("slscl/step1/超市销售数据.xlsx", dtype={"商品编码": str, "商品条码": str})
    
    # 创建一个新的ExcelWriter对象
    writer = pd.ExcelWriter("slscl/step1/类别销售.xlsx")
    
    # 获取商品类别的所有唯一值
    categories = df["商品金额数量"].unique()
    
    # 对每个唯一的商品类别,筛选出该类别的所有销售信息
    for category in categories:
        # 筛选当前类别的数据
        category_data = df[df["商品金额数量"] == category]
        
        # 为每个商品类别创建一个新的工作表,并写入数据
        category_data.to_excel(writer, sheet_name=str(category), index=False)
    
    # 保存"类别销售"Excel文件
    writer.save()
    

    这段代码首先读取了原始的Excel文件,然后获取了所有商品类别的唯一值。对于每个类别,它筛选出相应的数据,并为每个类别创建了一个新的工作表,将筛选后的数据写入。最后,它保存了新的Excel文件。

    请注意,由于你没有提供具体的文件路径和文件名,我在代码中使用了示例路径和文件名。你需要根据你的实际情况来替换这些路径和文件名。

    此外,由于我无法访问外部链接或提供具体的参考资料地址,我建议你查阅Pandas官方文档来获取更多关于read_excelExcelWriterto_excel方法的详细信息。Pandas的官方文档地址是:https://pandas.pydata.org/pandas-docs/stable/。

    希望这能帮助你完成任务!如果你有任何问题或需要进一步的帮助,请随时告诉我。

    评论 编辑记录

报告相同问题?

问题事件

  • 创建了问题 5月27日