xuxu20202020 2022-01-21 14:34 采纳率: 0%
浏览 36

tfidf计算文本相似度

目前有N个已经分好词的英文txt文件,希望通过tfidf计算两两txt之间的文本相似度

已分词文本示例:

img

是按空格进行的分词,图中为一个txt文件中的3条文本,需要实现的是两两txt文本之间每个文本相似度的计算,即类似一个矩阵,比如txt A有5个文本,txt B有3个文本,即计算这3x5个文本之间的相似度

  • 写回答

1条回答 默认 最新

  • zkhll 2022-01-21 16:52
    关注

    可以使用gensim包计算tf-idf
    具体使用方法可查看gensim官方文档

    评论

报告相同问题?

问题事件

  • 创建了问题 1月21日

悬赏问题

  • ¥15 树莓派与pix飞控通信
  • ¥15 自动转发微信群信息到另外一个微信群
  • ¥15 outlook无法配置成功
  • ¥30 这是哪个作者做的宝宝起名网站
  • ¥60 版本过低apk如何修改可以兼容新的安卓系统
  • ¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
  • ¥50 有数据,怎么建立模型求影响全要素生产率的因素
  • ¥50 有数据,怎么用matlab求全要素生产率
  • ¥15 TI的insta-spin例程
  • ¥15 完成下列问题完成下列问题