weixin_46963057 2023-01-14 21:48 采纳率: 100%
浏览 17
已结题

R 广义线性模型 — very large eigenvalue

因变量为正确率(0,1),自变量为一个分类变量,两个连续变量,family=binomial
显示model is nearly unidentifiable: very large eigenvalue

请问family的使用是否正确,以及如何解决警告?

  • 写回答

1条回答 默认 最新

  • 流比 2023-01-14 22:20
    关注

    广义线性模型 (Generalized Linear Model, GLM) 是一类常用于分析二项分布数据的统计模型。当因变量是二元变量时,可以使用 glm() 函数来拟合一个 GLM 模型,并使用 family 参数来指定二项分布的家族。

    在你的情况中,因变量是0,1,自变量是分类变量,连续变量。你使用 family=binomial 来指定二项分布家族,这是正确的。

    但是,如果你在拟合模型时遇到了 "model is nearly unidentifiable: very large eigenvalue" 的警告,这通常表明线性模型存在多重共线性问题。这可能是因为自变量之间存在高度相关性,或者是因为自变量的线性组合导致的。

    解决方法:

    你可以考虑删除一些自变量,或者使用不同的转换来降低自变量之间的相关性
    你可以尝试使用正则化技术,比如 L1 或 L2 正则化,来解决多重共线性问题。
    你可以尝试使用其他类型的模型,比如决策树或随机森林等。
    需要注意的是,在确定自变量的时候,还需要考虑自变量的可解释性和业务场景。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 1月22日
  • 已采纳回答 1月14日
  • 创建了问题 1月14日

悬赏问题

  • ¥15 按键修改电子时钟,C51单片机
  • ¥60 Java中实现如何实现张量类,并用于图像处理(不运用其他科学计算库和图像处理库))
  • ¥20 5037端口被adb自己占了
  • ¥15 python:excel数据写入多个对应word文档
  • ¥60 全一数分解素因子和素数循环节位数
  • ¥15 ffmpeg如何安装到虚拟环境
  • ¥188 寻找能做王者评分提取的
  • ¥15 matlab用simulink求解一个二阶微分方程,要求截图
  • ¥30 乘子法解约束最优化问题的matlab代码文件,最好有matlab代码文件
  • ¥15 写论文,需要数据支撑