this_is_w
2021-03-13 19:26
采纳率: 100%
浏览 115
已采纳

python数据处理如何批量修改列格式

用爬虫爬出了一堆数据,数据处理的时候,薪资这一列格式比较混乱 
基本是  1-2万/月。 部分是10-20万/年。还有200/天,


要做数据分析的话需要统一成纯数字


有无什么pandas可以把薪资这一列,带有万/月的行全部提取出来,然后统一调整格式
具体做法是怎样呢?

 

有些数据错误的将其他无关的信息放在了薪资这一栏,会不会对数据分析产生影响,是否可以找到并删除?

  • 写回答
  • 好问题 提建议
  • 关注问题
  • 收藏
  • 邀请回答

2条回答 默认 最新

  • 爱晚乏客游 2021-03-14 02:40
    已采纳

    可以的,先提取出月薪这一列数据,然后遍历这些数据,使用replace(“万/月”,“0000/月”)替换掉就行。

    已采纳该答案
    评论
    解决 无用
    打赏 举报
  • 可以用str.split() 对数据按照"/"分列, 这样薪资就有三种情况 月, 年 天, 然后把汉字万替换成数字; 

    评论
    解决 无用
    打赏 举报

相关推荐 更多相似问题