边小胖Python 2022-12-04 16:46 采纳率: 50%
浏览 3

如何让多组数据使用同一组标签编码

例如,使用sklearn的标签编码将训练集进行处理,那么测试集如何也使用一样的标签编码?
我对训练集和测试集使用标签编码,结果特征的标签编码不同,怎么解决?

  • 写回答

1条回答 默认 最新

  • ShowMeAI 2022-12-04 16:53
    关注

    你不要直接对数据用fit_transform,而是先对训练集fit后,再对训练集和测试集transform,如下例:

    from sklearn.preprocessing import LabelEncoder
    # 编码器
    le = LabelEncoder()
    # 训练集你和标签编码规则
    le.fit(train_data['col1'])
    # 训练集标签编码
    train_data['col1'] = le.transform(train_data['col1'])
    # 测试集标签编码
    test_data['col1'] = le.transform(test_data['col1'])
    
    评论

报告相同问题?

问题事件

  • 创建了问题 12月4日