目标值是最后一列 分为0和1 怎样才能分别处理缺失值呢?把目标值分离开来 然后分别计算 0的数据的缺失值 1的缺失值 代码应怎样编写来实现呢?

机器学习数据缺失值处理
目标值是最后一列 分为0和1 怎样才能分别处理缺失值呢?把目标值分离开来 然后分别计算 0的数据的缺失值 1的缺失值 代码应怎样编写来实现呢?
- 写回答
- 好问题 0 提建议
- 关注问题
- 邀请回答
-
1条回答 默认 最新
- ash062 2022-04-13 21:51关注
import pandas as pd import numpy as np data = pd.DataFrame({ 'a': [np.nan, 1, np.nan, 2, 3, np.nan, 4], 'b': [0, 0, 1, 1, 1, 1, 0] }) data_0 = data[data['b'] == 0] data_1 = data[data['b'] == 1] # 均值填充 data_0.fillna(data_0.mean(), inplace = True) data_1.fillna(data_1.mean(), inplace = True) data_new = pd.concat([data_0, data_1]).sort_index()
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 1无用