问题遇到的现象和发生背景
刚接触python classification中用到 PCA作为preprocessing, 了解到PCA 的作用是降低维度以获取最重要的信息。 我的理解是比如一个dataset, 是100行*10列,前9列是feature,最后一列是target。设置pca 为4,想找出最重要的4个features。但对数据进行pca后,我不知道那9列中的哪4列是被pca认定为最重要影响的?
用代码块功能插入代码,请勿粘贴截图
pca1=PCA(n_components=10)
scaled_transformed = pca.fit_transform(scaledData)
# Get principal components output
comps=np.round(pca.explained_variance_ratio_*100, decimals = 2)
print(comps)