相同的数据,用二元probit模型的时候模型出来下面会出现一行字:Note: 0 failures and 6 successes completely determined.用logit模型却不会出现,已验证vif均小于5,且两个模型结果有点差异,我能把二元probit换成logit模型继续做实证吗?这样换模型继续做实证的话有意义吗?非常感谢大家的解答


相同的数据,用二元probit模型的时候模型出来下面会出现一行字:Note: 0 failures and 6 successes completely determined.用logit模型却不会出现,已验证vif均小于5,且两个模型结果有点差异,我能把二元probit换成logit模型继续做实证吗?这样换模型继续做实证的话有意义吗?非常感谢大家的解答


关注引自免费微信小程序:皆我百晓生
在您提供的输出中,可以看到二元Probit模型和二元Logit模型的估计结果。从输出来看,二元Probit模型中有一行信息提到"0 failures and 6 successes completely determined",这表明存在完全分离的情况,即某些观测值的结果(失败或成功)完全由解释变量所确定,这种情况会导致参数估计不稳定,并可能影响模型的预测能力。
二元Logit模型没有显示出类似的问题,这可能是因为Logit模型对完全分离问题的处理更为宽容,但仍然可能存在某种程度上的多重共线性问题,尽管VIF检查显示都在可接受范围内。
关于您的问题,能否将二元Probit模型替换为二元Logit模型并继续进行实证分析,答案通常是肯定的,特别是在存在完全分离的情况下。这是因为二元Logit模型是更常用的模型,它对数据的分布假设较为宽松,通常不需要严格满足误差项正态分布的要求,而二元Probit模型则要求误差项必须是标准正态分布。此外,Logit模型的系数解释更容易理解,因为它给出了因变量取值为1的概率相对于基值变化的倍数。
然而,需要注意的是,即使更换了模型,由于完全分离的存在,模型可能还是存在问题。在这种情况下,您可以考虑以下几个建议:
下面是用R语言实现这两个模型的例子:
# 假设df是包含数据的DataFrame,cyyiyuan为目标变量,其他列是特征变量
library(nnet)
# 二元Probit模型
probit_model <- glm(cbind(cyyiyuan, 1 - cyyiyuan) ~ ., data = df, family = binomial("probit"))
summary(probit_model)
# 二元Logit模型
logit_model <- glm(cyyiyuan ~ ., data = df, family = binomial("logit"))
summary(logit_model)
根据模型的残差诊断、似然比检验以及模型的预测性能(如交叉验证下的准确性、ROC曲线等),选择最适合的模型。如果您决定继续使用Logit模型,请务必关注其假设条件,特别是独立性假设,因为完全分离可能暗示着这一假设的破坏。