jensonliu 2020-03-17 19:29 采纳率: 0%
浏览 963

关于推荐算法训练集和测试集的问题

最近在学习基于物品的协同过滤的推荐算法,是基于评分预测的,数据用了movielens,发现大部分网上的实现都划分了测试集和训练集,我目前的理解是这样的

  1. 把所有user-movie-rate划分测试集和训练集
  2. 使用训练集计算物品相似矩阵
  3. 使用该相似矩阵给测试集中的user-movie项目预测评分,并与测试集中的真实评分比较,评估算法指标(RMSE,MSE等)

首先不知道以上理解有没有错误?其次,如果要应用到实际推荐中,也就是要给所有user-movie都预测评分,是不是直接使用训练集得出的相似度矩阵来预测整个数据集即可? 测试集是否仅仅是为了评估算法性能的呢

  • 写回答

1条回答 默认 最新

  • 泪点潇湘 2020-04-02 09:43
    关注

    上面的理解没有问题,训练集可以预测user对movie的评分,然后测试集验证结果。
    实际推荐系统中不太会去计算user对每个movie的得分,一方面由于矩阵太大,另一方面user和movie一直都是增加的,一直更新全部关系成本高且收益小。简单的方法可以根据cf计算movie与movie的相似度,然后根据user对movie的兴趣进行相似movie的召回

    评论

报告相同问题?

悬赏问题

  • ¥15 高德地图点聚合中Marker的位置无法实时更新
  • ¥15 DIFY API Endpoint 问题。
  • ¥20 sub地址DHCP问题
  • ¥15 delta降尺度计算的一些细节,有偿
  • ¥15 Arduino红外遥控代码有问题
  • ¥15 数值计算离散正交多项式
  • ¥30 数值计算均差系数编程
  • ¥15 redis-full-check比较 两个集群的数据出错
  • ¥15 Matlab编程问题
  • ¥15 训练的多模态特征融合模型准确度很低怎么办