【提问】请教python调用sklearn完成特征工程问题

b_model = pd.read_csv('C:/Users/USER/Desktop/b_model.csv')

b_model_skip = b_model.drop(['borrower_index','begin_time','withhold_time_first','num_period_percent',

                   'f01','f02','f03','f04','f05','f06','f07','f08','f09','f10'],axis=1)

b_model_dropnan = b_model_skip.dropna()

b_model_dropnan_independentvariable = b_model_dropnan.drop(['target'],axis=1)

b_model_dropnan_label = b_model_dropnan.target

x, y = b_model_dropnan_independentvariable, b_model_dropnan_label

图片说明
这时候，b_model_dropnan_independentvariable 是Dataframe数据框格式，具有列名。

from sklearn.feature_selection import VarianceThreshold

sel = VarianceThreshold(threshold=(.8 * (1 - .8)))

b_model_dropnan_variancethreshold = sel.fit_transform(b_model_dropnan_independentvariable)

当我使用sklearn移除低方差特征后，b_model_dropnan_variancethreshold 是arrat数组格式，是没有列名的。

图片说明
这种情况下，首先，我确认是可以通过算法建立模型的，但数组没有列名的情况下，我后面如何确认feature importance呢？只确认留下是哪些与target高度相关的变量。

也无法转换为dataframe格式，然后重命名，毕竟特征数量过多，无法一一比对重新命令，而且有的低相关性变量也会变删除，很难进行比对。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
PIPIXIU 2018-07-09 09:04
关注
筛选后的列名可以获取到的啊

sel.get_support()

会返回一个布尔数组(array([ True, False, False, True])),
再通过下面的代码就把列名去除来了啊

cols = [b_model_dropnan_independentvariable.columns.values[i] for i,j in enumerate(sel.get_support()) if j]
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 2
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

【提问】请教python调用sklearn完成特征工程问题 python 算法
2018-07-06 07:03

回答 1 已采纳筛选后的列名可以获取到的啊 ``` sel.get_support() ``` 会返回一个布尔数组(array([ True, False, False, True])),
python调用sklearn中SGDRegressor和LinearRegression，报错显示不可调用 python 有问必答
2022-02-22 17:16

回答 3 已采纳建一个回归器对象： estimator1 = LinearRegression()报错是第34行y1_predict = estimator1(x_test)错误，缺少了对象的方法写成如下调用pred
Python 安装sklearn显示0.0。post1，运行程序显示没有sklearn python sklearn
2022-11-12 19:10

回答 2 已采纳安装sklearn库会报(0.0.post1)，安装 scikit_learn不会，而且程序也不会报错。pip install scikit_learn -i https://pypi.tuna.ts
python调用 matlab库_python调用matlab的搜索结果-阿里云开发者社区
2020-12-18 04:28

weixin_39964899的博客 2018python技术问答集锦，希望能给喜欢python的同学一些帮助小编发现问答专区中有很多人在问关于python的问题，小编把这些问题汇总一下，希望能给喜欢python的大家一些启示和帮助本帖不定期更新，喜欢的可以收藏哦...
请教python调用multiprocessing使用多进程修改全局变量问题 python
2020-05-12 18:08

回答 1 已采纳 https://blog.csdn.net/sinat_35360663/article/details/78328380?locationNum=8&fps=1
采用Catboost模型调用sklearn的permutation_importance计算贡献率时报错，如何解决？(语言-python) python sklearn 机器学习
2022-10-10 22:00

回答 6 已采纳 skelarn的permutation_importance不支持catboost等非sklearn原生模型。
python 贪心算法硬币找钱问题 python 动态规划有问必答贪心算法
2022-03-30 16:08

回答 3 已采纳 par = [0.05,0.1,0.2,0.5,1.0,2.0] #存储每种硬币，从小到大排列 sum = float(input("请输入需要找的零钱:")) #从面值最大的开始遍历 i = le
sklearn实战之逻辑回归与制作评分卡
2021-08-23 14:39

Litra LIN的博客然而逻辑回归，是一种名为“回归”的线性分类器，其本质是由线性回归变化而来的，一种广泛使用于分类问题中的广义线性回归算法。要理解逻辑回归从何而来，得要先理解线性回归。线性回归是机器学习中最简单的回国算法...
数据结构的算法复杂度 c++ c语言数据结构有问必答
2022-06-28 18:28

回答 3 已采纳没看到图片,你用文本的形式发题目吧
sklearn调用失败怎么回事 python sklearn
2022-09-16 13:53

回答 2 已采纳第一步点击这里：第二步输入： pip install sklearn
python安装sklearn库报错怎么办？ python
2021-12-05 12:50

回答 1 已采纳可能是pip版本不兼容，可以用AnaConda安装
Python数据分析入门笔记1——学习前的准备
2022-01-23 23:02

奥特曼打小白的博客文章目录前言一、Python数据分析学习之前的准备1.设备和环境准备2.知识储备二、基本概念介绍1. NumPy库2. Pandas库3. Matplotlib 库4. Seaborn库5. Sklearn 库三、Jupyter Notebook1. Jupyter Notebook介绍2. ...
已成功安装sklearn，Python使用from却无法使用！ python sklearn 人工智能
2022-04-07 20:37

回答 1 已采纳可以打印一下路径看sklearn的地址是否在其中 import sys # 图中sklearn的安装路径 sklearn_path = 'D:\\p.ython 3.8.0_x64\\lib\\si
机器学习Sklearn Day6
2022-03-03 23:15

birdooo的博客 2.4 二元回归与多元回归：重要参数solver & multi_class 之前我们对逻辑回归的讨论，都是针对二分类的逻辑回归展开，其实sklearn提供了多种可以使用逻辑回归处理多分类问题的选项。比如说，我们可以把某种分类...
机器学习-Sklearn-06（逻辑回归制作评分卡）
2022-03-05 01:48

Henrik698的博客机器学习-Sklearn-06（逻辑回归制作评分卡）
没有解决我的问题, 去提问

悬赏问题

¥15 执行 virtuoso 命令后，界面没有，cadence 启动不起来
¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
¥20 有关区间dp的问题求解
¥15 多电路系统共用电源的串扰问题
¥15 slam rangenet++配置
¥15 有没有研究水声通信方面的帮我改俩matlab代码
¥15 ubuntu子系统密码忘记
¥15 保护模式-系统加载-段寄存器
¥15 电脑桌面设定一个区域禁止鼠标操作
¥15 求NPF226060磁芯的详细资料