端午吃饱没 2023-02-19 11:44 采纳率: 57.9%
浏览 16
已结题

Python 字典搜寻出现dataframe一列中出现次数

有一个字典:
“Supplier A": ["A1", "A2"], “Supplier B": ["BD", "AS"]

有一个dataframe,其中一列为:

index
A10A2&A29; ASKX
BAD102
……
A129; A8SZ
B102&AS129

我想先用“; ”分割出字符串,然后再提取所有supplier A或者B字典内字符出现过的数量,也就是:

supplier Asupplier B
11
00
…………
10
01

第一行Supplier A里包含的A1, A2都出现了,最后一行Supplier B里包含的B1, AS都出现了,但是"; "分割成两个字符串,每个字符串出现一次即算一次,所以算一次。

  • 写回答

2条回答 默认 最新

  • 社区专家-Monster-XH 2023-02-19 11:57
    关注

    基于Monster 组和GPT的调写:
    定义一个函数,输入一个字符串和一个供应商字典,输出该字符串中该供应商字典内字符出现的次数。

    def count_supplier(string, supplier_dict):
        count = 0
        for value_list in supplier_dict.values():
            for value in value_list:
                if value in string:
                    count += 1
        return count
    
    
    

    对dataframe中的字符串列进行处理,先按照"; "进行分割,再调用count_supplier函数进行计数,最后将结果放入新的两列中。

    import pandas as pd
    
    # 定义供应商字典
    supplier_dict = {
        "Supplier A": ["A1", "A2"],
        "Supplier B": ["B1", "AS"]
    }
    
    # 定义函数
    def count_supplier(string, supplier_dict):
        count = 0
        for value_list in supplier_dict.values():
            for value in value_list:
                if value in string:
                    count += 1
        return count
    
    # 读取数据
    df = pd.read_csv('data.csv')
    
    # 分割字符串并计数
    df['split'] = df['index'].str.split('; ')
    df['supplier A'] = df['split'].apply(lambda x: sum([count_supplier(s, supplier_dict) for s in x if s]))
    df['supplier B'] = df['split'].apply(lambda x: sum([count_supplier(s, supplier_dict) for s in x if s]))
    
    # 删除中间列并输出结果
    df.drop('split', axis=1, inplace=True)
    print(df)
    
    
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 2月27日
  • 已采纳回答 2月19日
  • 创建了问题 2月19日

悬赏问题

  • ¥15 Attention is all you need 的代码运行
  • ¥15 一个服务器已经有一个系统了如果用usb再装一个系统,原来的系统会被覆盖掉吗
  • ¥15 使用esm_msa1_t12_100M_UR50S蛋白质语言模型进行零样本预测时,终端显示出了sequence handled的进度条,但是并不出结果就自动终止回到命令提示行了是怎么回事:
  • ¥15 前置放大电路与功率放大电路相连放大倍数出现问题
  • ¥30 关于<main>标签页面跳转的问题
  • ¥80 部署运行web自动化项目
  • ¥15 腾讯云如何建立同一个项目中物模型之间的联系
  • ¥30 VMware 云桌面水印如何添加
  • ¥15 用ns3仿真出5G核心网网元
  • ¥15 matlab答疑 关于海上风电的爬坡事件检测