徐2Q 2020-06-06 14:00 采纳率: 0%
浏览 933
已结题

scikitlearn的TFIDF特征计算报错,希望得到问题答案和相关方法实现的步骤和原理

1.在论坛里查找了TfidfVectorizer和fit____transform的相关资料,得知在训练集上使用fit____transform后,对测试集上则不需要fit直接使用transform,但是结果报错代码如下:
``
vectorizer = TfidfVectorizer(stop_words=stopWordList, sublinear_tf=True, max_df=0.5, vocabulary=trainbunch.vocabulary)
trainSpace.tdm = vectorizer.fit_transform(bunch.contents)
vectorizer = TfidfVectorizer(stop_words=stopWordList, sublinear_tf=True, max_df=0.5, vocabulary=trainbunch.vocabulary)
testSpace.tdm = vectorizer.transform(bunch.contents)

错误提示:sklearn.exceptions.NotFittedError: The TF-IDF vectorizer is not fitted

在网上寻找没找到答案,请问这是什么原因?
在网上找了很久并没有找到TfidfVectorizer和fit____transform这两个方法的详细实现过程和用到的原理,希望得到大家指点,谢谢。
  • 写回答

3条回答 默认 最新

  • dabocaiqq 2020-06-07 13:45
    关注
    评论

报告相同问题?

悬赏问题

  • ¥50 易语言把MYSQL数据库中的数据添加至组合框
  • ¥20 求数据集和代码#有偿答复
  • ¥15 关于下拉菜单选项关联的问题
  • ¥20 java-OJ-健康体检
  • ¥15 rs485的上拉下拉,不会对a-b<-200mv有影响吗,就是接受时,对判断逻辑0有影响吗
  • ¥15 使用phpstudy在云服务器上搭建个人网站
  • ¥15 应该如何判断含间隙的曲柄摇杆机构,轴与轴承是否发生了碰撞?
  • ¥15 vue3+express部署到nginx
  • ¥20 搭建pt1000三线制高精度测温电路
  • ¥15 使用Jdk8自带的算法,和Jdk11自带的加密结果会一样吗,不一样的话有什么解决方案,Jdk不能升级的情况