lmw0320 2019-04-08 13:46 采纳率: 75%
浏览 1558
已采纳

数据缺失值处理的几个疑问

数据中含有缺失值、异常值,及无意义的数值0. 我的操作步骤是先将数值0替换成缺失值。再对数据进行z-score标准化处理,找出异常值后,也将异常值替换成空值。再统一对缺失值进行填充处理。我的问题是:
1. 我的操作步骤是否合理?
2. 如果按照上述步骤,将数值0和异常值替换成缺失值后, 导致缺失值数量较多,无法进行填充处理,该如何解决?
3. 缺失值的填充,应该是针对原始数据进行的填充,而不会对标准化数据也同时进行填充吧? (原始数据缺失,标准化数据也同样缺失的)
4. 如第3步正确,那数据填充完毕,是否还要对数据再次进行标准化处理,以便后期建模(后期建模,考虑到量纲问题,有必要将标准化数据纳入建模,而非原始数据)。

  • 写回答

1条回答

  • devmiao 2019-04-08 17:13
    关注
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

悬赏问题

  • ¥15 (希望可以解决问题)ma和mb文件无法正常打开,打开后是空白,但是有正常内存占用,但可以在打开Maya应用程序后打开场景ma和mb格式。
  • ¥20 ML307A在使用AT命令连接EMQX平台的MQTT时被拒绝
  • ¥20 腾讯企业邮箱邮件可以恢复么
  • ¥15 有人知道怎么将自己的迁移策略布到edgecloudsim上使用吗?
  • ¥15 错误 LNK2001 无法解析的外部符号
  • ¥50 安装pyaudiokits失败
  • ¥15 计组这些题应该咋做呀
  • ¥60 更换迈创SOL6M4AE卡的时候,驱动要重新装才能使用,怎么解决?
  • ¥15 让node服务器有自动加载文件的功能
  • ¥15 jmeter脚本回放有的是对的有的是错的