问题遇到的现象和发生背景
在爬取数据后要对csv文件进行排序,但通过以下代码排序后发现顺序错误。
问题相关代码,请勿粘贴截图
运行结果及报错内容
还有爬取出来的文件:
我的解答思路和尝试过的方法
尝试了将单元格改为数值格式但是没有办法保存。
我想要达到的结果
希望能够根据csv文件的第五列进行排序并且去除后面的万和亿。
在爬取数据后要对csv文件进行排序,但通过以下代码排序后发现顺序错误。
尝试了将单元格改为数值格式但是没有办法保存。
希望能够根据csv文件的第五列进行排序并且去除后面的万和亿。
排序的地方换一下,先转换再排序
import re
def getnum(x):
num1=float(re.findall('(\d+\.?\d+)',x)[0])
num2=10000 if '亿' in x else 1 ##单位万
return num1*num2
capital['amt']=capital['5'].apply(getnum)
capital=capital.sort_values(by='amt',ascending=False)