在一项临床研究中,想要筛选变量进行建模,查阅了相似的文献,文献作者思路是这样的:先使用Lasso回归对全数据集筛选自变量,再分训练集和测试集,用Logistic回归、随机森林、神经网络对筛选后的自变量进行建模和检测,做出ROC和校准曲线,
然而我在复制这个模式时,额外做了一个二元多因素Logistic回归时,得到了4个p<0.05的自变量。这4个变量不都在Lasso回归筛选得到的变量中,Lasso回归筛选得到的变量,也不都有显著性。也就是说,逻辑回归中有显著性的是abcd,Lasso回归最后剩余的是abce
作为一个统计小白,不知道应该怎么理解这个情况,还请大神指点一下!谢谢!