2301_76184917 2023-03-10 17:28 采纳率: 50%
浏览 77
已结题

用pandas筛选csv文件里一列包含字典key值的行

请问怎么能用pandas筛选csv文件里一列包含字典key值的行,并根据字典value值分类

img

用这个学校字典匹配applicant里含有学校的行,并且根据字典的值分类储存

  • 写回答

5条回答 默认 最新

  • 社区专家-Monster-XH 2023-03-10 17:52
    关注

    基于Monster 组和GPT的调写:
    假设你有一个名为"applicants.csv"的CSV文件,其中包含"Applicant","PATkind"和"Title"列,你可以使用以下代码来筛选和分类:

    import pandas as pd
    
    # 创建学校字典
    school_dict = {'山东钢铁股份有限公司大学': 'School A', '辽宁科技学院': 'School B'}
    
    # 读取CSV文件
    df = pd.read_csv('applicants.csv')
    
    # 筛选出包含学校名称的行
    df = df[df['Applicant'].str.contains('|'.join(school_dict.keys()))]
    
    # 将学校名称转换为对应的分类
    df['School Category'] = df['Applicant'].replace(school_dict)
    
    # 保存结果到新的CSV文件
    df.to_csv('classified_applicants.csv', index=False)
    
    
    

    这里的关键步骤是使用str.contains()方法筛选出包含学校名称的行,并使用replace()方法将学校名称转换为对应的分类。最后,使用to_csv()方法将结果保存到新的CSV文件中

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(4条)

报告相同问题?

问题事件

  • 系统已结题 3月18日
  • 已采纳回答 3月10日
  • 赞助了问题酬金15元 3月10日
  • 修改了问题 3月10日
  • 展开全部

悬赏问题

  • ¥15 Vue3 大型图片数据拖动排序
  • ¥15 划分vlan后不通了
  • ¥15 GDI处理通道视频时总是带有白色锯齿
  • ¥20 用雷电模拟器安装百达屋apk一直闪退
  • ¥15 算能科技20240506咨询(拒绝大模型回答)
  • ¥15 自适应 AR 模型 参数估计Matlab程序
  • ¥100 角动量包络面如何用MATLAB绘制
  • ¥15 merge函数占用内存过大
  • ¥15 使用EMD去噪处理RML2016数据集时候的原理
  • ¥15 神经网络预测均方误差很小 但是图像上看着差别太大