数据中含有缺失值、异常值,及无意义的数值0. 我的操作步骤是先将数值0替换成缺失值。再对数据进行z-score标准化处理,找出异常值后,也将异常值替换成空值。再统一对缺失值进行填充处理。我的问题是:
1. 我的操作步骤是否合理?
2. 如果按照上述步骤,将数值0和异常值替换成缺失值后, 导致缺失值数量较多,无法进行填充处理,该如何解决?
3. 缺失值的填充,应该是针对原始数据进行的填充,而不会对标准化数据也同时进行填充吧? (原始数据缺失,标准化数据也同样缺失的)
4. 如第3步正确,那数据填充完毕,是否还要对数据再次进行标准化处理,以便后期建模(后期建模,考虑到量纲问题,有必要将标准化数据纳入建模,而非原始数据)。
数据缺失值处理的几个疑问
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
1条回答
悬赏问题
- ¥15 (希望可以解决问题)ma和mb文件无法正常打开,打开后是空白,但是有正常内存占用,但可以在打开Maya应用程序后打开场景ma和mb格式。
- ¥20 ML307A在使用AT命令连接EMQX平台的MQTT时被拒绝
- ¥20 腾讯企业邮箱邮件可以恢复么
- ¥15 有人知道怎么将自己的迁移策略布到edgecloudsim上使用吗?
- ¥15 错误 LNK2001 无法解析的外部符号
- ¥50 安装pyaudiokits失败
- ¥15 计组这些题应该咋做呀
- ¥60 更换迈创SOL6M4AE卡的时候,驱动要重新装才能使用,怎么解决?
- ¥15 让node服务器有自动加载文件的功能
- ¥15 jmeter脚本回放有的是对的有的是错的