要计算30万个文档的tfidf,idf字典已经计算好了,在计算tf-idf,用字典构建文档空间向量的时候内存不够。我也尝试把每一个文档的tfidf字典写入一个新文档,但是时间效率低,文档空间也过大。不知道该用什么样的方法高效地计算较大数据的tfidf并构建空间向量。