穆穆青风至 2022-09-15 19:52 采纳率: 97.4%
浏览 12
已结题

LFM(隐语义模型)算法的实现

做推荐系统的,下面是部分数据集

img

dtype=[('userId',np.int32),('movieId',np.int32),('rating',np.float32)]
dataset=pd.read_csv(DATA_PATH,usecols=range(3),dtype=dtype) # 读取csv文件
users_ratings=dataset.groupby('userId').agg([list])
items_ratings=dataset.groupby('movieId').agg([list])
# User-LF  10 代表 隐含因子个数是10个
P = dict(zip(users_ratings.index,np.random.rand(len(users_ratings),10).astype(np.float32)
        ))
# Item-LF
Q = dict(zip(items_ratings.index,np.random.rand(len(items_ratings),10).astype(np.float32)
        ))

# 梯度下降优化损失函数
for i in range(15):
        print('*' * 10, i)
        for uid, iid, real_rating in dataset.itertuples(index=False):
                # 遍历 用户 物品的评分数据 通过用户的id 到用户矩阵中获取用户向量
                v_puk = P[uid]
                # 通过物品的uid 到物品矩阵里获取物品向量
                v_qik = Q[iid]
                # 计算损失
                error = real_rating - np.dot(v_puk, v_qik)
                # 0.02学习率 0.01正则化系数
                v_puk += 0.02 * (error * v_qik - 0.01 * v_puk)
                v_qik += 0.02 * (error * v_puk - 0.01 * v_qik)

                P[uid] = v_puk
                Q[iid] = v_qik

v_puk += 0.02 * (error * v_qik - 0.01 * v_puk) 主要是这个向量的更新我不明白,为啥这么更新的

  • 写回答

1条回答 默认 最新

  • CSDN-Ada助手 CSDN-AI 官方账号 2022-09-15 20:20
    关注
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 9月27日
  • 已采纳回答 9月19日
  • 创建了问题 9月15日

悬赏问题

  • ¥15 基于卷积神经网络的声纹识别
  • ¥15 Python中的request,如何使用ssr节点,通过代理requests网页。本人在泰国,需要用大陆ip才能玩网页游戏,合法合规。
  • ¥100 为什么这个恒流源电路不能恒流?
  • ¥15 有偿求跨组件数据流路径图
  • ¥15 写一个方法checkPerson,入参实体类Person,出参布尔值
  • ¥15 我想咨询一下路面纹理三维点云数据处理的一些问题,上传的坐标文件里是怎么对无序点进行编号的,以及xy坐标在处理的时候是进行整体模型分片处理的吗
  • ¥15 CSAPPattacklab
  • ¥15 一直显示正在等待HID—ISP
  • ¥15 Python turtle 画图
  • ¥15 stm32开发clion时遇到的编译问题