端午吃饱没 2023-02-19 11:44 采纳率: 57.9%
浏览 16
已结题

Python 字典搜寻出现dataframe一列中出现次数

有一个字典:
“Supplier A": ["A1", "A2"], “Supplier B": ["BD", "AS"]

有一个dataframe,其中一列为:

index
A10A2&A29; ASKX
BAD102
……
A129; A8SZ
B102&AS129

我想先用“; ”分割出字符串,然后再提取所有supplier A或者B字典内字符出现过的数量,也就是:

supplier Asupplier B
11
00
…………
10
01

第一行Supplier A里包含的A1, A2都出现了,最后一行Supplier B里包含的B1, AS都出现了,但是"; "分割成两个字符串,每个字符串出现一次即算一次,所以算一次。

  • 写回答

2条回答 默认 最新

  • 社区专家-Monster-XH 2023-02-19 11:57
    关注

    基于Monster 组和GPT的调写:
    定义一个函数,输入一个字符串和一个供应商字典,输出该字符串中该供应商字典内字符出现的次数。

    def count_supplier(string, supplier_dict):
        count = 0
        for value_list in supplier_dict.values():
            for value in value_list:
                if value in string:
                    count += 1
        return count
    
    
    

    对dataframe中的字符串列进行处理,先按照"; "进行分割,再调用count_supplier函数进行计数,最后将结果放入新的两列中。

    import pandas as pd
    
    # 定义供应商字典
    supplier_dict = {
        "Supplier A": ["A1", "A2"],
        "Supplier B": ["B1", "AS"]
    }
    
    # 定义函数
    def count_supplier(string, supplier_dict):
        count = 0
        for value_list in supplier_dict.values():
            for value in value_list:
                if value in string:
                    count += 1
        return count
    
    # 读取数据
    df = pd.read_csv('data.csv')
    
    # 分割字符串并计数
    df['split'] = df['index'].str.split('; ')
    df['supplier A'] = df['split'].apply(lambda x: sum([count_supplier(s, supplier_dict) for s in x if s]))
    df['supplier B'] = df['split'].apply(lambda x: sum([count_supplier(s, supplier_dict) for s in x if s]))
    
    # 删除中间列并输出结果
    df.drop('split', axis=1, inplace=True)
    print(df)
    
    
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 2月27日
  • 已采纳回答 2月19日
  • 创建了问题 2月19日

悬赏问题

  • ¥15 metadata提取的PDF元数据,如何转换为一个Excel
  • ¥15 关于arduino编程toCharArray()函数的使用
  • ¥100 vc++混合CEF采用CLR方式编译报错
  • ¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误,如何解决?
  • ¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载
  • ¥15 c#逐行读取txt文本,但是每一行里面数据之间空格数量不同
  • ¥50 如何openEuler 22.03上安装配置drbd
  • ¥20 ING91680C BLE5.3 芯片怎么实现串口收发数据
  • ¥15 无线连接树莓派,无法执行update,如何解决?(相关搜索:软件下载)
  • ¥15 Windows11, backspace, enter, space键失灵