星野小菜 2021-11-02 19:12 采纳率: 60%
浏览 54
已结题

请问一下,文本处理的时候,测试集出现训练集没有的标签,该怎么处理数据才合理?

请问一下,文本处理的时候,测试集出现训练集没有的标签,该怎么处理数据才合理?(我现在是在把标签二值化的时候,测试集和训练集的标签合并后一起放进去fit了,我这样子这样合理吗?)

  • 写回答

1条回答 默认 最新

  • 行走的人偶 2021-11-03 10:35
    关注

    主要还是要看需求,才能判断这类数据是否有用,如果需求指定有这个类别,那就要合并,如果没有去掉也是没问题的。
    同时考虑到另一种情况,这类数据就是用来评判分类器在开放领域的能力,就是故意放一些没有训练过的类别数据去测试,看看分类器给出的结果,考验分类器是否能拒绝分类。实际应用中,分类器一般都是要考虑开放领域的识别能力,即并不是任何输入都要返回结果。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 11月26日
  • 已采纳回答 11月18日
  • 修改了问题 11月2日
  • 创建了问题 11月2日

悬赏问题

  • ¥15 fluent的在模拟压强时使用希望得到一些建议
  • ¥15 STM32驱动继电器
  • ¥15 Windows server update services
  • ¥15 关于#c语言#的问题:我现在在做一个墨水屏设计,2.9英寸的小屏怎么换4.2英寸大屏
  • ¥15 模糊pid与pid仿真结果几乎一样
  • ¥15 java的GUI的运用
  • ¥15 Web.config连不上数据库
  • ¥15 我想付费需要AKM公司DSP开发资料及相关开发。
  • ¥15 怎么配置广告联盟瀑布流
  • ¥15 Rstudio 保存代码闪退