引自免费微信小程序:皆我百晓生
从SPSS的Logistic回归输出结果进行数据分析,主要关注以下几个方面:
分类表
- 预测与实测:观察预测结果与实际结果的对比,了解模型的预测准确率。
- 正确百分比:步骤1中,针对target=0的预测准确率为76.8%,对于target=1的预测准确率为92.1%,总体预测准确率为85.1%。
方程中的变量
- B(系数):每个变量的系数表示在其他变量不变的情况下,该变量每增加一个单位时,对logit值的影响。
- 标准误差:用来评估系数估计的精确度。
- 瓦尔德:用于检验系数是否显著不等于零。
- 显著性:小于0.05通常认为变量对模型有显著贡献。
- Exp(B):即odds ratio,表示当自变量增加一个单位时,事件发生的几率变化的比例。
- 95%置信区间:表示exp(B)的置信范围。
例如,age的系数为-.005,意味着年龄每增加一岁,患心脏病的几率轻微下降。sex的系数为-1.758,假设男性编码为1,女性为0,则男性患心脏病的几率大约是女性的0.172倍,显著性为0.000,表明性别对患病几率有显著影响。
模型系数的Omnibus检验
- 卡方检验:检验模型整体是否比空模型(只包含截距项)有显著改善。
- 自由度:模型中变量的数量。
- 显著性:小于0.05表示模型整体上显著优于空模型。
模型摘要
- Cox & Snell R方 和 Nagelkerke R方:类似线性回归中的R方,衡量模型解释变异性的比例,但Logistic回归中没有完美的对应物。
- -2对数似然:模型的对数似然函数的两倍负值,用于比较模型拟合优劣。
霍斯默-莱梅肖检验
- 卡方检验:检验模型的预测概率与实际结果之间的匹配程度,值越小、p值越大表示模型拟合越好。
方程中的变量(步骤0)
- 步骤0的输出显示了模型在没有变量时的情况,常量的系数为.179,显著性为0.121,表示仅考虑截距项时模型效果不佳。
未包括在方程中的变量
- 图3显示了如果将这些变量逐一加入模型时的得分情况,所有变量的得分均大于1且显著性小于0.05,表明所有变量都对模型有显著贡献,应被纳入模型中。
个案处理摘要
- 显示了数据集中个案的总数,以及是否有缺失值。此数据集共包含303个样本,无缺失值。
通过以上分析,我们可以得出模型的整体表现、各变量对模型的贡献以及模型的拟合程度。在实际应用中,还需要结合业务知识对模型结果进行解读,并可能需要进一步调整模型参数或选择变量以优化模型性能。