性别这一列应该怎么做缺失值处理?性别这一列可以用到回归模型里吗?
收起
缺失值处理要根据具体情况,通常的方法:1)删除该样本,2)补0或预置值,3)补平均值,4)用上一个样本值或滑动平均值代替
具体到你提出的问题,性别只有 男/女(忽略其它)相当于 0/1,估计相邻样本不存在明显的相关性,且高达 39% 数据缺失,这就不适合补充该数据了,建议直接删除该列,即忽略性别的影响。
如果分析认为 性别 对于分析结果影响很大,不能忽略,建议只能想办法再收集该数据,而不是按某种规则填补了。
报告相同问题?