计算文本相关度,余弦定理和距离有什么不同,KNN为什么不用余弦定理而应用欧式距离?
1条回答 默认 最新
- 关阝强 2018-02-28 07:34关注
余弦定理是衡量三个点之间的关系,距离是衡量两个点之间平面长度。数据挖掘中的分类和聚类算法基本是使用欧几里得距离。欧几里得距离衡量的是多维空间中各个点之间的绝对距离。所以无论是多少个文本对比,维度再多,欧几里得距离都能计算出差异。但是余弦和距离局限就很大了。所以这就是为什么在数据挖掘中很多算法都是用欧几里得距离
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报