随机森林回归重要性排序
OOB estimate of error rate: 56.74%
这个错误率是不是有点高啊,有评定标准嘛
随机森林回归重要性排序
OOB estimate of error rate: 56.74%
这个错误率是不是有点高啊,有评定标准嘛
基于平均减少不纯度(Mean Decrease Impurity):这是最常用的特征重要性排序方法。它通过计算每个特征在随机森林中用于分割节点时所减少的不纯度的平均值来评估特征的重要性。较高的平均减少不纯度值表示该特征对模型的预测能力贡献较大。
基于平均准确率(Mean Decrease Accuracy):这种方法通过随机重排某个特征的值来破坏该特征与目标变量之间的关系,然后计算模型在重排后的数据上的准确率下降情况。准确率下降越大,说明该特征对模型的预测能力贡献越大。
基于节点纯度(Node Impurity):这种方法计算每个特征在每个节点上用于分割时所减少的不纯度,然后将其加权平均得到特征的重要性。这种方法更加细粒度地评估了特征在每个节点上的贡献。