weixin_46963057 2023-01-14 21:48 采纳率: 100%
浏览 18
已结题

R 广义线性模型 — very large eigenvalue

因变量为正确率(0,1),自变量为一个分类变量,两个连续变量,family=binomial
显示model is nearly unidentifiable: very large eigenvalue

请问family的使用是否正确,以及如何解决警告?

  • 写回答

1条回答 默认 最新

  • 流比 2023-01-14 22:20
    关注

    广义线性模型 (Generalized Linear Model, GLM) 是一类常用于分析二项分布数据的统计模型。当因变量是二元变量时,可以使用 glm() 函数来拟合一个 GLM 模型,并使用 family 参数来指定二项分布的家族。

    在你的情况中,因变量是0,1,自变量是分类变量,连续变量。你使用 family=binomial 来指定二项分布家族,这是正确的。

    但是,如果你在拟合模型时遇到了 "model is nearly unidentifiable: very large eigenvalue" 的警告,这通常表明线性模型存在多重共线性问题。这可能是因为自变量之间存在高度相关性,或者是因为自变量的线性组合导致的。

    解决方法:

    你可以考虑删除一些自变量,或者使用不同的转换来降低自变量之间的相关性
    你可以尝试使用正则化技术,比如 L1 或 L2 正则化,来解决多重共线性问题。
    你可以尝试使用其他类型的模型,比如决策树或随机森林等。
    需要注意的是,在确定自变量的时候,还需要考虑自变量的可解释性和业务场景。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 1月22日
  • 已采纳回答 1月14日
  • 创建了问题 1月14日

悬赏问题

  • ¥15 在若依框架下实现人脸识别
  • ¥15 网络科学导论,网络控制
  • ¥100 安卓tv程序连接SQLSERVER2008问题
  • ¥15 利用Sentinel-2和Landsat8做一个水库的长时序NDVI的对比,为什么Snetinel-2计算的结果最小值特别小,而Lansat8就很平均
  • ¥15 metadata提取的PDF元数据,如何转换为一个Excel
  • ¥15 关于arduino编程toCharArray()函数的使用
  • ¥100 vc++混合CEF采用CLR方式编译报错
  • ¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误,如何解决?
  • ¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载
  • ¥15 c#逐行读取txt文本,但是每一行里面数据之间空格数量不同