例如,使用sklearn的标签编码将训练集进行处理,那么测试集如何也使用一样的标签编码?
我对训练集和测试集使用标签编码,结果特征的标签编码不同,怎么解决?
如何让多组数据使用同一组标签编码
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
1条回答 默认 最新
- ShowMeAI 2022-12-04 16:53关注
你不要直接对数据用fit_transform,而是先对训练集fit后,再对训练集和测试集transform,如下例:
from sklearn.preprocessing import LabelEncoder # 编码器 le = LabelEncoder() # 训练集你和标签编码规则 le.fit(train_data['col1']) # 训练集标签编码 train_data['col1'] = le.transform(train_data['col1']) # 测试集标签编码 test_data['col1'] = le.transform(test_data['col1'])
解决 无用评论 打赏 举报
悬赏问题
- ¥15 关于#单片机#的问题:Lora通讯模块hc-14电路图求内部原理图
- ¥50 esp32 wroom 32e 芯片解锁
- ¥15 bywave配置文件写入失败
- ¥20 基于Simulink的ZPW2000轨道电路仿真
- ¥15 pycharm找不到在环境装好的opencv-python
- ¥15 在不同的执行界面调用同一个页面
- ¥20 基于51单片机的数字频率计
- ¥50 M3T长焦相机如何标定以及正射影像拼接问题
- ¥15 keepalived的虚拟VIP地址 ping -s 发包测试,只能通过1472字节以下的数据包(相关搜索:静态路由)
- ¥15 Mabatis查询数据