weixin_39808315 2021-07-02 09:14 采纳率: 40%
浏览 75
已采纳

pandas处理Excel列数据

各位大神,我把整个需求描述出来,昨天提出的已经被采纳,非常感谢,但我接触python只有两天,没有开发经验,所以还得大神帮忙看看如何解决

学校有张招生的数据表,列字段有100多个,由于我只需要特定的一些列字段,大概在50个左右,所以我通过usecols的方式提取出需要的字段,但是提取出来的有些字段需要处理下数据,比如【录取专业】字段,这个字段下有一部分单元格前面有空格和数字,我想通过pandas将这些字段里面这些过滤掉,然后将特定的字段保存到新的Excel中,请问该怎么写这个代码

import pandas as pd
name = (input('请输入文件名:')+'.xls')

table = pd.read_excel('work.xls',usecols=["来源省","学号","考生号","姓名","身份证","院系","录取专业"],dtype=str)

print (table)
table.to_excel(name+'转换后.xlsx',index=False)

原始数据截图:
img

  • 写回答

2条回答 默认 最新

  • 7*24 工作者 2021-07-02 09:41
    关注
    #!/usr/bin/env python
    #-*- coding:utf-8 -*-
    
    import pandas as pd
    import re
    name = (input('请输入文件名:') + '.xls')
    table = pd.read_excel('work.xls', usecols=["来源省", "学号", "考生号", "姓名", "身份证", "院系", "录取专业"], dtype=str)
    
    print(table)
    table['录取专业'] = table['录取专业'].map(lambda x:x.replace(' ',''))
    table['录取专业'] = table['录取专业'].map(lambda x:re.sub('\d+','',x,count=1))
    print(table)
    table.to_excel(name + '转换后.xlsx', index=False)
    
    
    ####示例演示
    import pandas as pd
    import re
    names = [' 金融工程','金融工程','1电子商务','2电子商务','3电子商务']
    df = pd.DataFrame(names,columns=['录取专业'])
    print(df['录取专业'])
    df['录取专业'] = df['录取专业'].map(lambda x:x.replace(' ',''))
    df['录取专业'] = df['录取专业'].map(lambda x:re.sub('\d+','',x,count=1))
    print('============')
    print(df['录取专业'])
    

    img

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

悬赏问题

  • ¥15 关于#matlab#的问题:在模糊控制器中选出线路信息,在simulink中根据线路信息生成速度时间目标曲线(初速度为20m/s,15秒后减为0的速度时间图像)我想问线路信息是什么
  • ¥15 banner广告展示设置多少时间不怎么会消耗用户价值
  • ¥16 mybatis的代理对象无法通过@Autowired装填
  • ¥15 可见光定位matlab仿真
  • ¥15 arduino 四自由度机械臂
  • ¥15 wordpress 产品图片 GIF 没法显示
  • ¥15 求三国群英传pl国战时间的修改方法
  • ¥15 matlab代码代写,需写出详细代码,代价私
  • ¥15 ROS系统搭建请教(跨境电商用途)
  • ¥15 AIC3204的示例代码有吗,想用AIC3204测量血氧,找不到相关的代码。