边小胖Python 2022-12-04 16:46 采纳率: 50%
浏览 3

如何让多组数据使用同一组标签编码

例如,使用sklearn的标签编码将训练集进行处理,那么测试集如何也使用一样的标签编码?
我对训练集和测试集使用标签编码,结果特征的标签编码不同,怎么解决?

  • 写回答

1条回答 默认 最新

  • ShowMeAI 2022-12-04 16:53
    关注

    你不要直接对数据用fit_transform,而是先对训练集fit后,再对训练集和测试集transform,如下例:

    from sklearn.preprocessing import LabelEncoder
    # 编码器
    le = LabelEncoder()
    # 训练集你和标签编码规则
    le.fit(train_data['col1'])
    # 训练集标签编码
    train_data['col1'] = le.transform(train_data['col1'])
    # 测试集标签编码
    test_data['col1'] = le.transform(test_data['col1'])
    
    评论

报告相同问题?

问题事件

  • 创建了问题 12月4日

悬赏问题

  • ¥15 关于#单片机#的问题:Lora通讯模块hc-14电路图求内部原理图
  • ¥50 esp32 wroom 32e 芯片解锁
  • ¥15 bywave配置文件写入失败
  • ¥20 基于Simulink的ZPW2000轨道电路仿真
  • ¥15 pycharm找不到在环境装好的opencv-python
  • ¥15 在不同的执行界面调用同一个页面
  • ¥20 基于51单片机的数字频率计
  • ¥50 M3T长焦相机如何标定以及正射影像拼接问题
  • ¥15 keepalived的虚拟VIP地址 ping -s 发包测试,只能通过1472字节以下的数据包(相关搜索:静态路由)
  • ¥15 Mabatis查询数据