已经了解余弦相似度的大概思路,但是代码写不出来,请教各位同学
3条回答 默认 最新
社区专家-Monster-XH 2023-04-20 22:08关注基于Monster 组和GPT的调写:
PHP 的余弦相似度计算函数:
function cosine_similarity($vector1, $vector2) { $dot_product = 0.0; $magnitude1 = 0.0; $magnitude2 = 0.0; foreach ($vector1 as $key => $value) { $magnitude1 += $value * $value; if (isset($vector2[$key])) { $dot_product += $value * $vector2[$key]; } } foreach ($vector2 as $key => $value) { $magnitude2 += $value * $value; } if ($magnitude1 == 0.0 || $magnitude2 == 0.0) { return 0.0; } return $dot_product / (sqrt($magnitude1) * sqrt($magnitude2)); }
- 其中 vector1 和 vector2 都是一维数组,表示两个向量。函数首先计算两个向量的点积,然后计算两个向量的大小(即范数),最后将点积除以两个向量的大小之积,得到余弦相似度。
在使用该函数时,可以将两个向量表示为关联数组,键表示特征或维度,值表示该特征或维度的权重。例如:
$vector1 = array('apple' => 3, 'banana' => 2, 'orange' => 1); $vector2 = array('apple' => 1, 'banana' => 2, 'pear' => 3); $similarity = cosine_similarity($vector1, $vector2); echo $similarity; // 输出 0.80473785412429
- 该示例中,vector1 和 vector2 都是关联数组,表示两篮水果的特征向量,其中 "apple"、"banana"、"orange" 和 "pear" 是维度,对应的值是该维度上的权重。函数返回的 $similarity 是一个浮点数,表示两个向量的余弦相似度。
本回答被题主选为最佳回答 , 对您是否有帮助呢?评论 打赏 举报解决 1无用