CSDN222111 2021-11-05 11:17 采纳率: 50%
浏览 19

统计学习方法--决策树

有没有哪位给解释解释什么叫做“选择取值较多的特征”。信息增益比和信息增益都有啥特点啊?

img

  • 写回答

1条回答 默认 最新

  • XINFINFZ 2021-11-05 15:33
    关注

    img


    根据上面这个算式,如果我此时引入了A4(极端点想,没有分到样本),前面的分母是不是从5/15(三分之一)变成了四分之一,此时条件熵就变小了,信息增益=熵-条件熵,我的信息增益就变大了,那我引入a5,a6,前面分母就变成了五分之一,六分之一。特征取值越多是不是信息增益就越大。所以才引入了信息增益比来平衡这个现象。或者你也可以这么理解,信息增益是信息不确定性减少的程度,如果一个特征它的取值很多,是不是意味着我非常了解这个特征,就比如明天的天气有多云,晴天,下雨,下暴风雪 和 只有晴天和雨天相比是不是感觉信息确定了很多,所以信息增益也会越大。

    评论

报告相同问题?

问题事件

  • 创建了问题 11月5日

悬赏问题

  • ¥15 安卓adb backup备份应用数据失败
  • ¥15 eclipse运行项目时遇到的问题
  • ¥15 关于#c##的问题:最近需要用CAT工具Trados进行一些开发
  • ¥15 南大pa1 小游戏没有界面,并且报了如下错误,尝试过换显卡驱动,但是好像不行
  • ¥15 没有证书,nginx怎么反向代理到只能接受https的公网网站
  • ¥50 成都蓉城足球俱乐部小程序抢票
  • ¥15 yolov7训练自己的数据集
  • ¥15 esp8266与51单片机连接问题(标签-单片机|关键词-串口)(相关搜索:51单片机|单片机|测试代码)
  • ¥15 电力市场出清matlab yalmip kkt 双层优化问题
  • ¥30 ros小车路径规划实现不了,如何解决?(操作系统-ubuntu)