如题,还是说将所有的变量放到算法里就好了。变量太多运行会慢,可不可以先看相关性,挑选相关性高的变量放到算法里。
感谢!
收起
如果能够剔除对结果无影响或影响甚微的变量,当然是最好的。不过,要想逐一确定哪些变量和结果之间存在较高的相关性,也并非易事。通常,降维是首选的手段,而主成分分析(PCA)是降维最常用的方法。
报告相同问题?