weixin_46963057 2023-01-14 21:48 采纳率: 100%
浏览 17
已结题

R 广义线性模型 — very large eigenvalue

因变量为正确率(0,1),自变量为一个分类变量,两个连续变量,family=binomial
显示model is nearly unidentifiable: very large eigenvalue

请问family的使用是否正确,以及如何解决警告?

  • 写回答

1条回答 默认 最新

  • 流比 2023-01-14 22:20
    关注

    广义线性模型 (Generalized Linear Model, GLM) 是一类常用于分析二项分布数据的统计模型。当因变量是二元变量时,可以使用 glm() 函数来拟合一个 GLM 模型,并使用 family 参数来指定二项分布的家族。

    在你的情况中,因变量是0,1,自变量是分类变量,连续变量。你使用 family=binomial 来指定二项分布家族,这是正确的。

    但是,如果你在拟合模型时遇到了 "model is nearly unidentifiable: very large eigenvalue" 的警告,这通常表明线性模型存在多重共线性问题。这可能是因为自变量之间存在高度相关性,或者是因为自变量的线性组合导致的。

    解决方法:

    你可以考虑删除一些自变量,或者使用不同的转换来降低自变量之间的相关性
    你可以尝试使用正则化技术,比如 L1 或 L2 正则化,来解决多重共线性问题。
    你可以尝试使用其他类型的模型,比如决策树或随机森林等。
    需要注意的是,在确定自变量的时候,还需要考虑自变量的可解释性和业务场景。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 1月22日
  • 已采纳回答 1月14日
  • 创建了问题 1月14日

悬赏问题

  • ¥15 linux驱动,linux应用,多线程
  • ¥20 我要一个分身加定位两个功能的安卓app
  • ¥15 基于FOC驱动器,如何实现卡丁车下坡无阻力的遛坡的效果
  • ¥15 IAR程序莫名变量多重定义
  • ¥15 (标签-UDP|关键词-client)
  • ¥15 关于库卡officelite无法与虚拟机通讯的问题
  • ¥15 目标检测项目无法读取视频
  • ¥15 GEO datasets中基因芯片数据仅仅提供了normalized signal如何进行差异分析
  • ¥100 求采集电商背景音乐的方法
  • ¥15 数学建模竞赛求指导帮助