数据中含有缺失值、异常值,及无意义的数值0. 我的操作步骤是先将数值0替换成缺失值。再对数据进行z-score标准化处理,找出异常值后,也将异常值替换成空值。再统一对缺失值进行填充处理。我的问题是:
1. 我的操作步骤是否合理?
2. 如果按照上述步骤,将数值0和异常值替换成缺失值后, 导致缺失值数量较多,无法进行填充处理,该如何解决?
3. 缺失值的填充,应该是针对原始数据进行的填充,而不会对标准化数据也同时进行填充吧? (原始数据缺失,标准化数据也同样缺失的)
4. 如第3步正确,那数据填充完毕,是否还要对数据再次进行标准化处理,以便后期建模(后期建模,考虑到量纲问题,有必要将标准化数据纳入建模,而非原始数据)。
数据缺失值处理的几个疑问
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
1条回答 默认 最新
悬赏问题
- ¥15 C++使用Gunplot
- ¥15 这个电路是如何实现路灯控制器的,原理是什么,怎么求解灯亮起后熄灭的时间如图?
- ¥15 matlab数字图像处理频率域滤波
- ¥15 在abaqus做了二维正交切削模型,给刀具添加了超声振动条件后输出切削力为什么比普通切削增大这么多
- ¥15 ELGamal和paillier计算效率谁快?
- ¥15 file converter 转换格式失败 报错 Error marking filters as finished,如何解决?
- ¥15 Arcgis相交分析无法绘制一个或多个图形
- ¥15 关于#r语言#的问题:差异分析前数据准备,报错Error in data[, sampleName1] : subscript out of bounds请问怎么解决呀以下是全部代码:
- ¥15 seatunnel-web使用SQL组件时候后台报错,无法找到表格
- ¥15 fpga自动售货机数码管(相关搜索:数字时钟)