例如,使用sklearn的标签编码将训练集进行处理,那么测试集如何也使用一样的标签编码?
我对训练集和测试集使用标签编码,结果特征的标签编码不同,怎么解决?
如何让多组数据使用同一组标签编码
- 写回答
- 好问题 0 提建议
- 关注问题
- 邀请回答
-
1条回答 默认 最新
ShowMeAI 2022-12-04 16:53关注你不要直接对数据用fit_transform,而是先对训练集fit后,再对训练集和测试集transform,如下例:
from sklearn.preprocessing import LabelEncoder # 编码器 le = LabelEncoder() # 训练集你和标签编码规则 le.fit(train_data['col1']) # 训练集标签编码 train_data['col1'] = le.transform(train_data['col1']) # 测试集标签编码 test_data['col1'] = le.transform(test_data['col1'])解决 无用评论 打赏 举报