已经用sklearn跑出来tf-idf的权重矩阵,现在我还想复现下文的工作,想向各路大神们求教!
收起
当前问题酬金
¥ 0 (可追加 ¥500)
支付方式
扫码支付
支付金额 15 元
提供问题酬金的用户不参与问题酬金结算和分配
支付即为同意 《付费问题酬金结算规则》
即某一个文件中高频出现的词条,以及该词条在整个语料库文件中低频出现的现象,可以产生出高权重的TF-IDF。因此,TF-IDF倾向于过滤掉常见的词语,保留重要的词语。即:字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。
报告相同问题?