SunHaYu 2021-09-28 04:32 采纳率: 100%

# 用Python画箱型图并用IQR方法找到并除去异常值

We want to compare distribution of EEDI an EIV values. We used matplotlib boxplot to draw two boxplots side by side to each other as shown below. We can see many outliers in the Technical Efficiency Values. Let's use IQR method to remove such outliers.

IQR Method: The interquartile range (IQR) is calculated as the difference between the 75th and the 25th percentiles of the data. The IQR method considers observations with values 1.5 times above that of the 25th percentile or above that of the 75th percentile as outliers.

For each dataframe, df_eedi and df_eiv, calculate the lower and upper limit for the Technical Efficiency Value. The lower limit is 1.5 times of IQR below 25th percentile whereas the upper limit is 1.5 times of IQR above 75th percentile.

• 写回答

#### 1条回答默认 最新

• CSDN专家-HGJ 2021-09-28 16:23
关注

这个首先获取两个列数据中的四分位差IQR=Q3-Q1,
a,b=df['device'].quantile([0.25,0.75])
IQR=b-a
获取到IQR,
然后使用语句：

df=df[(df['device']>a-1.5*IQR) & (df['device']<b+1.5*IQR)]
print(df)


剔除掉异常数据。

如有帮助请采纳。

本回答被题主选为最佳回答 , 对您是否有帮助呢?
评论

• 系统已结题 10月6日
• 已采纳回答 9月28日
• 创建了问题 9月28日

#### 悬赏问题

• ¥20 求解答（matlab）
• ¥30 ffmpeg库使用过程中遇到的问题
• ¥15 pyqt5 中python如何通过Qtwebchannel主动发消息给web前端
• ¥15 关于HTML中title获取xml内容的问题
• ¥15 fanuc机器人PRIO083数字信号未复原错误，如何解决？
• ¥20 如何为现有电路板增加远程控制功能
• ¥15 C#点击按钮的时候的循环次数就是最后一次，如何是循环第几次的值？
• ¥15 UE5打包失败，求解决
• ¥15 请问STM32G431的CANOPEN协议函数怎么写