穆穆青风至 2022-09-15 19:52 采纳率: 97.4%
浏览 11
已结题

LFM(隐语义模型)算法的实现

做推荐系统的,下面是部分数据集

img

dtype=[('userId',np.int32),('movieId',np.int32),('rating',np.float32)]
dataset=pd.read_csv(DATA_PATH,usecols=range(3),dtype=dtype) # 读取csv文件
users_ratings=dataset.groupby('userId').agg([list])
items_ratings=dataset.groupby('movieId').agg([list])
# User-LF  10 代表 隐含因子个数是10个
P = dict(zip(users_ratings.index,np.random.rand(len(users_ratings),10).astype(np.float32)
        ))
# Item-LF
Q = dict(zip(items_ratings.index,np.random.rand(len(items_ratings),10).astype(np.float32)
        ))

# 梯度下降优化损失函数
for i in range(15):
        print('*' * 10, i)
        for uid, iid, real_rating in dataset.itertuples(index=False):
                # 遍历 用户 物品的评分数据 通过用户的id 到用户矩阵中获取用户向量
                v_puk = P[uid]
                # 通过物品的uid 到物品矩阵里获取物品向量
                v_qik = Q[iid]
                # 计算损失
                error = real_rating - np.dot(v_puk, v_qik)
                # 0.02学习率 0.01正则化系数
                v_puk += 0.02 * (error * v_qik - 0.01 * v_puk)
                v_qik += 0.02 * (error * v_puk - 0.01 * v_qik)

                P[uid] = v_puk
                Q[iid] = v_qik

v_puk += 0.02 * (error * v_qik - 0.01 * v_puk) 主要是这个向量的更新我不明白,为啥这么更新的

  • 写回答

1条回答 默认 最新

  • CSDN-Ada助手 CSDN-AI 官方账号 2022-09-15 20:20
    关注
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 9月27日
  • 已采纳回答 9月19日
  • 创建了问题 9月15日

悬赏问题

  • ¥60 如何把照片修复成原始拍摄图
  • ¥80 Exited too quickly (process log may have details)
  • ¥15 爬知乎登录之后内容加载不出来
  • ¥15 怎么用protues测量通频带
  • ¥15 zepelin使用sparkInterpreter 异常
  • ¥15 paho mqtt 接收不到消息
  • ¥15 函数r关于两个分量y,z方向上的图像,分开画r随y的图像,r随z的图像
  • ¥15 如何用Matlab求Pearcey函数的数值积分?
  • ¥15 一个简单的函数定义问题,输出结果是相反的,怎么回事呢?
  • ¥15 页面加载报错,不知道怎么处理