this_is_w 2021-03-13 19:26 采纳率: 100%
浏览 190
已采纳

python数据处理如何批量修改列格式

用爬虫爬出了一堆数据,数据处理的时候,薪资这一列格式比较混乱 
基本是  1-2万/月。 部分是10-20万/年。还有200/天,


要做数据分析的话需要统一成纯数字


有无什么pandas可以把薪资这一列,带有万/月的行全部提取出来,然后统一调整格式
具体做法是怎样呢?

 

有些数据错误的将其他无关的信息放在了薪资这一栏,会不会对数据分析产生影响,是否可以找到并删除?

  • 写回答

2条回答 默认 最新

  • 爱晚乏客游 2021-03-14 02:40
    关注

    可以的,先提取出月薪这一列数据,然后遍历这些数据,使用replace(“万/月”,“0000/月”)替换掉就行。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?