计算文本相关度,余弦定理和距离有什么不同,KNN为什么不用余弦定理而应用欧式距离?
1条回答
- 关阝强 2018-02-28 07:34关注
余弦定理是衡量三个点之间的关系,距离是衡量两个点之间平面长度。数据挖掘中的分类和聚类算法基本是使用欧几里得距离。欧几里得距离衡量的是多维空间中各个点之间的绝对距离。所以无论是多少个文本对比,维度再多,欧几里得距离都能计算出差异。但是余弦和距离局限就很大了。所以这就是为什么在数据挖掘中很多算法都是用欧几里得距离
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报
悬赏问题
- ¥15 oracle集群安装出bug
- ¥15 关于#python#的问题:自动化测试
- ¥20 问题请教!vue项目关于Nginx配置nonce安全策略的问题
- ¥15 教务系统账号被盗号如何追溯设备
- ¥20 delta降尺度方法,未来数据怎么降尺度
- ¥15 c# 使用NPOI快速将datatable数据导入excel中指定sheet,要求快速高效
- ¥15 再不同版本的系统上,TCP传输速度不一致
- ¥15 高德地图2.0 版本点聚合中Marker的位置无法实时更新,如何解决呢?
- ¥15 DIFY API Endpoint 问题。
- ¥20 sub地址DHCP问题