目前在用机器学习算法解决一个多分类问题,手动提的特征,20多维。有两个类别总是被错误分类成对方,尝试了随机森林、KNN、决策树、XGBoost都是一样的效果。输出特征重要程度feature_importances,发现有一维特征,我认为应该是这两类最关键的区分特征,但是特征重要性却很低,请问这是什么原因?能用什么方法干预吗,比如手动调整特征权重?
求大佬指点
目前在用机器学习算法解决一个多分类问题,手动提的特征,20多维。有两个类别总是被错误分类成对方,尝试了随机森林、KNN、决策树、XGBoost都是一样的效果。输出特征重要程度feature_importances,发现有一维特征,我认为应该是这两类最关键的区分特征,但是特征重要性却很低,请问这是什么原因?能用什么方法干预吗,比如手动调整特征权重?
求大佬指点
就是特征值这两个类的占比。比如特征值等于1 ,a类占比多少,b类占比多少 。这两个占比区分度越大,对目标值越有可能高权值