穆穆青风至 2022-09-15 19:52 采纳率: 97.4%
浏览 13
已结题

LFM(隐语义模型)算法的实现

做推荐系统的,下面是部分数据集

img

dtype=[('userId',np.int32),('movieId',np.int32),('rating',np.float32)]
dataset=pd.read_csv(DATA_PATH,usecols=range(3),dtype=dtype) # 读取csv文件
users_ratings=dataset.groupby('userId').agg([list])
items_ratings=dataset.groupby('movieId').agg([list])
# User-LF  10 代表 隐含因子个数是10个
P = dict(zip(users_ratings.index,np.random.rand(len(users_ratings),10).astype(np.float32)
        ))
# Item-LF
Q = dict(zip(items_ratings.index,np.random.rand(len(items_ratings),10).astype(np.float32)
        ))

# 梯度下降优化损失函数
for i in range(15):
        print('*' * 10, i)
        for uid, iid, real_rating in dataset.itertuples(index=False):
                # 遍历 用户 物品的评分数据 通过用户的id 到用户矩阵中获取用户向量
                v_puk = P[uid]
                # 通过物品的uid 到物品矩阵里获取物品向量
                v_qik = Q[iid]
                # 计算损失
                error = real_rating - np.dot(v_puk, v_qik)
                # 0.02学习率 0.01正则化系数
                v_puk += 0.02 * (error * v_qik - 0.01 * v_puk)
                v_qik += 0.02 * (error * v_puk - 0.01 * v_qik)

                P[uid] = v_puk
                Q[iid] = v_qik

v_puk += 0.02 * (error * v_qik - 0.01 * v_puk) 主要是这个向量的更新我不明白,为啥这么更新的

  • 写回答

1条回答 默认 最新

  • CSDN-Ada助手 CSDN-AI 官方账号 2022-09-15 20:20
    关注
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 9月27日
  • 已采纳回答 9月19日
  • 创建了问题 9月15日

悬赏问题

  • ¥15 Ubuntu开机显示器只显示kernel,是没操作系统(相关搜索:显卡驱动)
  • ¥15 VB.NET如何绘制倾斜的椭圆
  • ¥15 在rhel8中安装qemu-kvm时遇到“cannot initialize crypto:unable to initialize gcrypt“报错”
  • ¥15 arbotix没有/cmd_vel话题
  • ¥15 paddle库安装时报错提示需要安装common、dual等库,安装了上面的库以后还是显示报错未安装,要怎么办呀?
  • ¥20 找能定制Python脚本的
  • ¥15 odoo17的分包重新供应路线如何设置?可从销售订单中实时直接触发采购订单或相关单据
  • ¥15 用C语言怎么判断字符串的输入是否符合设定?
  • ¥15 通信专业本科生论文选这两个哪个方向好研究呀
  • ¥50 我在一个购物网站的排队系统排队,这个排队到号后重新定向到目标网站进行购物,但是有技术牛通过技术方法直接跳过排队系统进入目标网址购物,有没有什么软件或者脚本可以用