下里巴人. 2022-09-16 03:58 采纳率: 54.5%
浏览 72
已结题

python求多维向量余弦值

问题遇到的现象和发生背景

算出来的余弦值大于1

用代码块功能插入代码,请勿粘贴截图
import xlrd
from math import pow

excle_file = r"我的文件地址"

data = xlrd.open_workbook(excle_file)

def get_unknow_centre(n):   #矩阵中心化

    table = data.sheet_by_name('Sheet3')

    c = list(table.row_values(n-1))

    sum_c = sum(c)

    ave_c = sum_c/14

    d = [x-ave_c for x in c]

    return d

def get_know_centre(m):

    table = data.sheet_by_name('Sheet3')

    e = list(table.row_values(m-1))

    sum_e = sum(e)

    ave_e = sum_e/14

    f = [x-ave_e for x in e]

    return  f



if __name__ == '__main__':

    m = int(input('请输入对比到的行数:'))
    
    n = int(input('请输入未知颜色的行数:'))



    unknow_row_centre = get_unknow_centre(n)

    know_row_centre = get_know_centre(m)

    pow_unknow = pow((sum([w**2 for w in unknow_row_centre])),1/2)

    pow_know = pow((sum([z**2 for z in know_row_centre ])),1/2)
    
    Similarity = (sum([o*p for o in unknow_row_centre for p in know_row_centre if unknow_row_centre.index(o)==know_row_centre.index(p)]))/(pow_unknow * pow_know)

    print(Similarity)

运行结果及报错内容

similarity值大于1 我想算的是两个向量的余弦值

我想要达到的结果

余弦值正常

  • 写回答

2条回答 默认 最新

  • 天元浪子 Python领域优质创作者 2022-09-16 09:02
    关注

    计算结果远大于1还是非常接近于1?如果是后者,我猜可能是浮点数累计误差造成的。计算向量余弦的算法,貌似是正确的,但代码有很多值得商榷之处,比如:

    1. python内置pow函数,无需从math导入;
    2. python内置sun函数,精度低于math.fsum函数;
    3. 自定义的get_unknow_centre函数和get_know_centre函数应该是完全一样的吧?
    4. 向量点乘无需嵌套循环,使用zip函数一次循环即可。

    建议题主尝试一下numpy,更适合计算此类问题。以下是一个计算向量余弦的例子。

    import math
    import numpy as np
    v1 = [1.5, 2.6, 3.7]
    v2 = [-2.3, 3.5, -4.9]
    m1 = np.linalg.norm(v1) # 计算向量v1的模(2范)
    m2 = np.linalg.norm(v2) # 计算向量v2的模(2范)
    similarity = np.dot(v1, v2) / (m1 * m2)
    similarity
    -0.40636485717113935
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 9月24日
  • 已采纳回答 9月16日
  • 赞助了问题酬金10元 9月16日
  • 创建了问题 9月16日

悬赏问题

  • ¥15 关于#matlab#的问题:在模糊控制器中选出线路信息,在simulink中根据线路信息生成速度时间目标曲线(初速度为20m/s,15秒后减为0的速度时间图像)我想问线路信息是什么
  • ¥15 banner广告展示设置多少时间不怎么会消耗用户价值
  • ¥16 mybatis的代理对象无法通过@Autowired装填
  • ¥15 可见光定位matlab仿真
  • ¥15 arduino 四自由度机械臂
  • ¥15 wordpress 产品图片 GIF 没法显示
  • ¥15 求三国群英传pl国战时间的修改方法
  • ¥15 matlab代码代写,需写出详细代码,代价私
  • ¥15 ROS系统搭建请教(跨境电商用途)
  • ¥15 AIC3204的示例代码有吗,想用AIC3204测量血氧,找不到相关的代码。