问题遇到的现象和发生背景
机器学习解决二分类问题中,对分类变量进行独热编码后,如果再进行特征重要性排序,就会出现多个哑变量出现在重要性排序里的情况。例如性别男,性别女均在重要性排序中,而我想看的是性别这个总的特征的重要性
我的解答思路和尝试过的方法
这种情况是应该拒绝独热编码,还是应该先筛选变量?
机器学习解决二分类问题中,对分类变量进行独热编码后,如果再进行特征重要性排序,就会出现多个哑变量出现在重要性排序里的情况。例如性别男,性别女均在重要性排序中,而我想看的是性别这个总的特征的重要性
这种情况是应该拒绝独热编码,还是应该先筛选变量?