weixin_41469397
2019-04-06 21:37
浏览 3.0k

数据特征处理--ONEHOTENCODER如何实操

1.问题描述
数据对象有N列,其中某几列是属于分类特征,其他都是连续变量。
1)在采用MLPRegressor()以前是不是要针对这几列数据进行OneHotEncoder();
2)怎么对数据集对象单独几列进行独热编码,baidu都是清一色的整个数据集对象OneHotEncoder()
2.源码
new_data =np.array(data)
y = new_data[:,13]
X = new_data[:,0:13]
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.83)
X_scale=preprocessing.scale(X)
enc = OneHotEncoder()
X_train = enc.fit(X_train[:,0:1])
scaler = StandardScaler().fit(X_train)
X_train = scaler.transform(X_train)
X_test = scaler.transform(X_test)

  • 写回答
  • 好问题 提建议
  • 关注问题
  • 收藏
  • 邀请回答

相关推荐 更多相似问题