穆穆青风至 2022-09-15 19:52 采纳率: 97.4%
浏览 13
已结题

LFM(隐语义模型)算法的实现

做推荐系统的,下面是部分数据集

img

dtype=[('userId',np.int32),('movieId',np.int32),('rating',np.float32)]
dataset=pd.read_csv(DATA_PATH,usecols=range(3),dtype=dtype) # 读取csv文件
users_ratings=dataset.groupby('userId').agg([list])
items_ratings=dataset.groupby('movieId').agg([list])
# User-LF  10 代表 隐含因子个数是10个
P = dict(zip(users_ratings.index,np.random.rand(len(users_ratings),10).astype(np.float32)
        ))
# Item-LF
Q = dict(zip(items_ratings.index,np.random.rand(len(items_ratings),10).astype(np.float32)
        ))

# 梯度下降优化损失函数
for i in range(15):
        print('*' * 10, i)
        for uid, iid, real_rating in dataset.itertuples(index=False):
                # 遍历 用户 物品的评分数据 通过用户的id 到用户矩阵中获取用户向量
                v_puk = P[uid]
                # 通过物品的uid 到物品矩阵里获取物品向量
                v_qik = Q[iid]
                # 计算损失
                error = real_rating - np.dot(v_puk, v_qik)
                # 0.02学习率 0.01正则化系数
                v_puk += 0.02 * (error * v_qik - 0.01 * v_puk)
                v_qik += 0.02 * (error * v_puk - 0.01 * v_qik)

                P[uid] = v_puk
                Q[iid] = v_qik

v_puk += 0.02 * (error * v_qik - 0.01 * v_puk) 主要是这个向量的更新我不明白,为啥这么更新的

  • 写回答

1条回答 默认 最新

  • CSDN-Ada助手 CSDN-AI 官方账号 2022-09-15 20:20
    关注
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 9月27日
  • 已采纳回答 9月19日
  • 创建了问题 9月15日

悬赏问题

  • ¥15 在若依框架下实现人脸识别
  • ¥15 网络科学导论,网络控制
  • ¥100 安卓tv程序连接SQLSERVER2008问题
  • ¥15 利用Sentinel-2和Landsat8做一个水库的长时序NDVI的对比,为什么Snetinel-2计算的结果最小值特别小,而Lansat8就很平均
  • ¥15 metadata提取的PDF元数据,如何转换为一个Excel
  • ¥15 关于arduino编程toCharArray()函数的使用
  • ¥100 vc++混合CEF采用CLR方式编译报错
  • ¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误,如何解决?
  • ¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载
  • ¥15 c#逐行读取txt文本,但是每一行里面数据之间空格数量不同