但夕 2021-06-11 00:11 采纳率: 50%
浏览 19

文本分类,调用模型时报错:含有1165个feature,要求1000个feature怎么解决?

是因为测试集没有做和训练时一样的降维处理吗?

我使用了vec = TfidfVectorizer(ngram_range=(1, 2), analyzer='char')和selector = SelectKBest(f_classif, k=1000)降低训练集和验证集的维度

调用模型时,测试集降维是要求和训练时降维方法相同还是只要降到一样维度就可以?

若使用同样方法降维,应该怎么做?

  • 写回答

1条回答 默认 最新

  • Alexxinlu 2021-06-11 09:37
    关注

    一般情况下,要保证训练和测试的数据集预处理和降维的方式一样,不然就算维度一样,效果也不会好的,要保证训练集和测试集的分布一样才行。

    评论

报告相同问题?

悬赏问题

  • ¥15 用三极管设计—个共射极放大电路
  • ¥15 请完成下列相关问题!
  • ¥15 drone 推送镜像时候 purge: true 推送完毕后没有删除对应的镜像,手动拷贝到服务器执行结果正确在样才能让指令自动执行成功删除对应镜像,如何解决?
  • ¥15 求daily translation(DT)偏差订正方法的代码
  • ¥15 js调用html页面需要隐藏某个按钮
  • ¥15 ads仿真结果在圆图上是怎么读数的
  • ¥20 Cotex M3的调试和程序执行方式是什么样的?
  • ¥20 java项目连接sqlserver时报ssl相关错误
  • ¥15 一道python难题3
  • ¥15 牛顿斯科特系数表表示