穆穆青风至 2022-09-15 19:52 采纳率: 97.4%
浏览 12
已结题

LFM(隐语义模型)算法的实现

做推荐系统的,下面是部分数据集

img

dtype=[('userId',np.int32),('movieId',np.int32),('rating',np.float32)]
dataset=pd.read_csv(DATA_PATH,usecols=range(3),dtype=dtype) # 读取csv文件
users_ratings=dataset.groupby('userId').agg([list])
items_ratings=dataset.groupby('movieId').agg([list])
# User-LF  10 代表 隐含因子个数是10个
P = dict(zip(users_ratings.index,np.random.rand(len(users_ratings),10).astype(np.float32)
        ))
# Item-LF
Q = dict(zip(items_ratings.index,np.random.rand(len(items_ratings),10).astype(np.float32)
        ))

# 梯度下降优化损失函数
for i in range(15):
        print('*' * 10, i)
        for uid, iid, real_rating in dataset.itertuples(index=False):
                # 遍历 用户 物品的评分数据 通过用户的id 到用户矩阵中获取用户向量
                v_puk = P[uid]
                # 通过物品的uid 到物品矩阵里获取物品向量
                v_qik = Q[iid]
                # 计算损失
                error = real_rating - np.dot(v_puk, v_qik)
                # 0.02学习率 0.01正则化系数
                v_puk += 0.02 * (error * v_qik - 0.01 * v_puk)
                v_qik += 0.02 * (error * v_puk - 0.01 * v_qik)

                P[uid] = v_puk
                Q[iid] = v_qik

v_puk += 0.02 * (error * v_qik - 0.01 * v_puk) 主要是这个向量的更新我不明白,为啥这么更新的

  • 写回答

1条回答 默认 最新

  • CSDN-Ada助手 CSDN-AI 官方账号 2022-09-15 20:20
    关注
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 9月27日
  • 已采纳回答 9月19日
  • 创建了问题 9月15日

悬赏问题

  • ¥15 请提供一个符合要求的网页链接。
  • ¥20 用HslCommunication 连接欧姆龙 plc有时会连接失败。报异常为“未知错误”
  • ¥15 网络设备配置与管理这个该怎么弄
  • ¥20 机器学习能否像多层线性模型一样处理嵌套数据
  • ¥20 西门子S7-Graph,S7-300,梯形图
  • ¥50 用易语言http 访问不了网页
  • ¥50 safari浏览器fetch提交数据后数据丢失问题
  • ¥15 matlab不知道怎么改,求解答!!
  • ¥15 永磁直线电机的电流环pi调不出来
  • ¥15 用stata实现聚类的代码