lmw0320
2019-04-08 13:46
采纳率: 100%
浏览 1.5k

数据缺失值处理的几个疑问

数据中含有缺失值、异常值,及无意义的数值0. 我的操作步骤是先将数值0替换成缺失值。再对数据进行z-score标准化处理,找出异常值后,也将异常值替换成空值。再统一对缺失值进行填充处理。我的问题是:
1. 我的操作步骤是否合理?
2. 如果按照上述步骤,将数值0和异常值替换成缺失值后, 导致缺失值数量较多,无法进行填充处理,该如何解决?
3. 缺失值的填充,应该是针对原始数据进行的填充,而不会对标准化数据也同时进行填充吧? (原始数据缺失,标准化数据也同样缺失的)
4. 如第3步正确,那数据填充完毕,是否还要对数据再次进行标准化处理,以便后期建模(后期建模,考虑到量纲问题,有必要将标准化数据纳入建模,而非原始数据)。

  • 点赞
  • 写回答
  • 关注问题
  • 收藏
  • 邀请回答

1条回答 默认 最新

相关推荐 更多相似问题