计算文本相关度,应用余弦定理和距离有什么不同,两者都可以吗?

计算文本相关度,余弦定理和距离有什么不同,KNN为什么不用余弦定理而应用欧式距离?

1个回答

余弦定理是衡量三个点之间的关系,距离是衡量两个点之间平面长度。数据挖掘中的分类和聚类算法基本是使用欧几里得距离。欧几里得距离衡量的是多维空间中各个点之间的绝对距离。所以无论是多少个文本对比,维度再多,欧几里得距离都能计算出差异。但是余弦和距离局限就很大了。所以这就是为什么在数据挖掘中很多算法都是用欧几里得距离

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!