N096kaka 2022-12-12 12:00 采纳率: 100%
浏览 46
已结题

机器学习特征重要性的问题

机器学习特征重要性
特征重要性的model.feature_importance中 跟训练集和测试集的划分(包括random_state的不同设置)有没有关系呀?
train_test_split 中划分不同比例的测试集和设置不同random_state数值 最后得到的特征重要性model.feature_importances数值不同,但是排序大部分是一样的

请问这个原理是啥呀?

  • 写回答

4条回答 默认 最新

  • 生产队的小刘 Python领域新星创作者 2022-12-12 12:29
    关注

    是的,训练集和测试集的划分和随机数种子对模型的特征重要性有一定影响。不同的划分方式可能会导致模型对不同特征的重要性的评估不同,因为模型在训练时可能会更加关注某些特定的特征。同时,由于机器学习算法通常都包含随机性,所以使用不同的随机数种子可能会导致模型学习到的内容不同,从而导致特征重要性的评估不同。

    尽管如此,大部分情况下特征重要性的排序是相似的。这是因为模型通常会对更重要的特征更加关注,所以它们的重要性往往会比较高。当然,这并不意味着排名完全一样,但是大多数情况下排名都是相似的。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(3条)

报告相同问题?

问题事件

  • 系统已结题 12月21日
  • 已采纳回答 12月13日
  • 创建了问题 12月12日

悬赏问题

  • ¥15 stm32代码移植没反应
  • ¥15 matlab基于pde算法图像修复,为什么只能对示例图像有效
  • ¥100 连续两帧图像高速减法
  • ¥15 组策略中的计算机配置策略无法下发
  • ¥15 如何绘制动力学系统的相图
  • ¥15 对接wps接口实现获取元数据
  • ¥20 给自己本科IT专业毕业的妹m找个实习工作
  • ¥15 用友U8:向一个无法连接的网络尝试了一个套接字操作,如何解决?
  • ¥30 我的代码按理说完成了模型的搭建、训练、验证测试等工作(标签-网络|关键词-变化检测)
  • ¥50 mac mini外接显示器 画质字体模糊