2301_76184917 2023-03-10 17:28 采纳率: 50%
浏览 77
已结题

用pandas筛选csv文件里一列包含字典key值的行

请问怎么能用pandas筛选csv文件里一列包含字典key值的行,并根据字典value值分类

img

用这个学校字典匹配applicant里含有学校的行,并且根据字典的值分类储存

  • 写回答

5条回答 默认 最新

  • 社区专家-Monster-XH 2023-03-10 17:52
    关注

    基于Monster 组和GPT的调写:
    假设你有一个名为"applicants.csv"的CSV文件,其中包含"Applicant","PATkind"和"Title"列,你可以使用以下代码来筛选和分类:

    import pandas as pd
    
    # 创建学校字典
    school_dict = {'山东钢铁股份有限公司大学': 'School A', '辽宁科技学院': 'School B'}
    
    # 读取CSV文件
    df = pd.read_csv('applicants.csv')
    
    # 筛选出包含学校名称的行
    df = df[df['Applicant'].str.contains('|'.join(school_dict.keys()))]
    
    # 将学校名称转换为对应的分类
    df['School Category'] = df['Applicant'].replace(school_dict)
    
    # 保存结果到新的CSV文件
    df.to_csv('classified_applicants.csv', index=False)
    
    
    

    这里的关键步骤是使用str.contains()方法筛选出包含学校名称的行,并使用replace()方法将学校名称转换为对应的分类。最后,使用to_csv()方法将结果保存到新的CSV文件中

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(4条)

报告相同问题?

问题事件

  • 系统已结题 3月18日
  • 已采纳回答 3月10日
  • 赞助了问题酬金15元 3月10日
  • 修改了问题 3月10日
  • 展开全部

悬赏问题

  • ¥15 merge函数占用内存过大
  • ¥15 Revit2020下载问题
  • ¥15 使用EMD去噪处理RML2016数据集时候的原理
  • ¥15 神经网络预测均方误差很小 但是图像上看着差别太大
  • ¥15 Oracle中如何从clob类型截取特定字符串后面的字符
  • ¥15 想通过pywinauto自动电机应用程序按钮,但是找不到应用程序按钮信息
  • ¥15 如何在炒股软件中,爬到我想看的日k线
  • ¥15 seatunnel 怎么配置Elasticsearch
  • ¥15 PSCAD安装问题 ERROR: Visual Studio 2013, 2015, 2017 or 2019 is not found in the system.
  • ¥15 (标签-MATLAB|关键词-多址)