Old金 2018-04-11 02:42 采纳率: 0%
浏览 5096
已结题

NLP文本相似度 余弦相似度和Jaccard相似度的算法

请问各路大神,我刚开始接触NLP,老师让我们自学人类语言的相似性度量

我研究了naive的不加权的余弦相似度和Jaccard相似度

老师要求我们研究他们的算法,由于我算法太渣,知道运算原理但是总结不出算法

请哪位大神能够指点一下,告诉我这两个算法的伪代码怎么弄,谢啦

  • 写回答

1条回答 默认 最新

  • a414878523 2018-04-11 04:51
    关注

    余弦相似度的伪代码就是原来的公式,在真正实现的时候,A和B都是按照向量存储的(不是数组,是线性代数库中的向量),可以直接加,减,点积,取模
    Jaccard同理,在实现时,A和B就是集合存储的,直接按照公式计算就行

    评论

报告相同问题?

悬赏问题

  • ¥15 基于卷积神经网络的声纹识别
  • ¥15 Python中的request,如何使用ssr节点,通过代理requests网页。本人在泰国,需要用大陆ip才能玩网页游戏,合法合规。
  • ¥100 为什么这个恒流源电路不能恒流?
  • ¥15 有偿求跨组件数据流路径图
  • ¥15 写一个方法checkPerson,入参实体类Person,出参布尔值
  • ¥15 我想咨询一下路面纹理三维点云数据处理的一些问题,上传的坐标文件里是怎么对无序点进行编号的,以及xy坐标在处理的时候是进行整体模型分片处理的吗
  • ¥15 CSAPPattacklab
  • ¥15 一直显示正在等待HID—ISP
  • ¥15 Python turtle 画图
  • ¥15 stm32开发clion时遇到的编译问题