首先,画出箱型图,
然后用IQR方法排除异常值,
先计算IQR
IQR=value(25%)-value(75%)
异常值范围=【value(25%)-IQR,value(75%)+IQR】
手动计算了异常值范围(不懂有没有用程序处理的方法来计算)
之后需要把表中的数据的异常值排除
想请教一下,我该怎么操作呢?
首先,画出箱型图,
然后用IQR方法排除异常值,
先计算IQR
IQR=value(25%)-value(75%)
异常值范围=【value(25%)-IQR,value(75%)+IQR】
手动计算了异常值范围(不懂有没有用程序处理的方法来计算)
之后需要把表中的数据的异常值排除
想请教一下,我该怎么操作呢?
可用numpy的percentile或panda的quantile函数来求分位数,类似这样:
a,b=df['device'].quantile([0.25,0.75])
IQR=b-a
print(b-a)
df=df[(df['device']>=a-1.5*IQR) & (df['device']<=b+1.5*IQR)]
df=df.set_index('geoNetwork')
print(df)