NLP文本相似度余弦相似度和Jaccard相似度的算法

请问各路大神，我刚开始接触NLP，老师让我们自学人类语言的相似性度量

我研究了naive的不加权的余弦相似度和Jaccard相似度

老师要求我们研究他们的算法，由于我算法太渣，知道运算原理但是总结不出算法

请哪位大神能够指点一下，告诉我这两个算法的伪代码怎么弄，谢啦

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
a414878523 2018-04-11 04:51
关注
余弦相似度的伪代码就是原来的公式，在真正实现的时候，A和B都是按照向量存储的（不是数组，是线性代数库中的向量），可以直接加，减，点积，取模
Jaccard同理，在实现时，A和B就是集合存储的，直接按照公式计算就行

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

如何结合计算机视觉和自然语言处理还有3D建模，实现输入句子生成短视频 3D电影 3D模型？人工智能自然语言处理计算机视觉
2022-03-31 16:27

回答 1 已采纳给你道，要求能生成万物。
如何写一个通用人工智能软件？人工智能深度学习自然语言处理
2022-03-31 15:18

回答 4 已采纳目前我们还达不到强人工智能，你说的这些暂时还没有办法实现。
自然语言处理关于文本匹配方法 python 自然语言处理
2020-07-09 18:20

回答 1 已采纳 https://blog.csdn.net/ling620/article/details/95468908
计算文本相似度的常用算法
2021-03-07 14:33

氧小氢的博客 NLP、数据挖掘领域中，文本分析是一个很重要的领域，这有助于我们去让计算机理解语言的作用和使用。文本分析是数据挖掘的重要手段，利用文本分析，我们将很快的读取到一本书、一篇文章、一段话中的关键词和核心思想...
想知道自然语言处理分词时如何如何抉择正向最大匹配、逆向最大匹配和双向最大匹配自然语言处理
2023-01-18 07:48

回答 2 已采纳首先我们要明白：正向最大匹配是采用从左到右的方式，从句子中抽取一个子串作为一块词；逆向最大匹配是采用从右到左的方式，从句子中抽取一个子串作为一块词；而双向最大匹配是采用正向最大匹配和逆向最大匹配的结合
如何实现自然语言处理？制作一个3D游戏，内含所有的名词，形容词，动词，副词。实现输入一句话，就显示一个3D动画。语言变3D电影 python 人工智能自然语言处理
2022-03-31 18:41

回答 5 已采纳首先，你的3D模型必须自成一库，切含括绝大多数的普遍性物体和生命，亦或者将思路转化为像人物捏脸一般，通过输入的字段，通过神经网络比对和深入后返回的物体的一切特征，然后进行捏脸环节的拼接，元素化地生成每
自然语言处理中如何将超参数进行调优？自然语言处理
2022-12-14 12:44

回答 1 已采纳在划分数据集以供循环神经网络 (RNN) 使用时，通常建议使用训练集、验证集和测试集。训练集用于训练RNN，验证集用于调整RNN的超参数，测试集用于评估训练好的RNN的性能。如果您使用具有不同类型循
文本相似度计算：Jaccard系数，余弦相似度等
2020-03-24 22:41

yang_live的博客文本相似度计算是把文本投影到向量空间，文本的相似度是把文本投影到向量空间，用向量相似度来表示语义相似度，通过比较计算向量的空间距离来比较文本的相似度。 Jaccard系数 Jaccard系数是计算两个集合重合度的常用...
目前人工智能写作达到什么水平了？人工智能自然语言处理
2019-11-01 21:24

回答 1 已采纳 google下dcgan做文本生成，还有seq2seq文本序列预测的paper，这几年进步还是很大的。
python 大量文本数据预处理（NLP），跑的很慢，是否可以用上GPU加速 linux python 有问必答自然语言处理
2022-02-24 11:25

回答 3 已采纳可以用啊，判断GPU是否可用，否则使用cpu device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
除了神经网络的文本检测算法之外，还有哪些检测算法啊？请教相关人士。数据挖掘机器学习自然语言处理
2019-05-22 16:46

回答 2 已采纳简单文本分类用朴素贝叶斯就好了
文本相似度ld和lcs算法—c语言版,文本相似度计算_01
2021-05-26 02:47

weixin_39861882的博客近期准备整理一下自然语言处理方面用到的技术，之前工作都是按照工作需求来走，对用到的技术算法也没有做一下系统性的整体，所以近期准备系统性的整理一下自然语言处理相关的内容。初步构想涉及6个方面的问题。文本...
自然语言处理学习的问题自然语言处理
2021-06-21 19:54

回答 1 已采纳从我个人的学习经验来看，学习自然语言处理是一个不断积累的过程，我之前主要从以下几个方面学习： 1. 书籍： (1) 数学之美 - 吴军（入门） (2) 计算语言学 - 刘颖 (3) 统计自然
余弦相似度和Jaccard相似度算法 python 文本相似度计算系统
2024-02-14 22:51

豆包程序员的博客随着人工智能的快速发展，最近大火的OpenAI提出的ChatGPT颠覆了整个人工智能的行走轨迹，相应的自然语言处理就成为了各个领域的一个研究重点，所以如何有效地处理和利用大量的文本数据已成为一个重要的挑战。...
自然语言处理中的文本相似度分析：算法与实现
2023-06-29 04:26

禅与计算机程序设计艺术的博客作者：禅与计算机程序设计艺术《自然语言处理中的文本相似度分析：算法与实现》引言 1.1. 背景介绍自然语言处理（Natural Language Processing, NLP）是研究人类语言的
没有解决我的问题, 去提问

悬赏问题

¥15 基于卷积神经网络的声纹识别
¥15 Python中的request，如何使用ssr节点，通过代理requests网页。本人在泰国，需要用大陆ip才能玩网页游戏，合法合规。
¥100 为什么这个恒流源电路不能恒流？
¥15 有偿求跨组件数据流路径图
¥15 写一个方法checkPerson，入参实体类Person，出参布尔值
¥15 我想咨询一下路面纹理三维点云数据处理的一些问题，上传的坐标文件里是怎么对无序点进行编号的，以及xy坐标在处理的时候是进行整体模型分片处理的吗
¥15 CSAPPattacklab
¥15 一直显示正在等待HID—ISP
¥15 Python turtle 画图
¥15 stm32开发clion时遇到的编译问题

NLP文本相似度 余弦相似度和Jaccard相似度的算法

1条回答 默认 最新

悬赏问题

NLP文本相似度余弦相似度和Jaccard相似度的算法

1条回答默认最新