猫的歪 2014-12-17 13:14
浏览 1289

基于时间的矩阵分解模型,如何chulinetflix数据集

我在根据项亮著作《推荐系统实践》第八章中的加入时间的矩阵分解模型做实验时,也就是timeSVD++。但是我遇到的问题是:数据集(2007年netflix比赛数据)如何处理。书上写的是把用户的评分时间从早到晚排序,取前90%作为训练集,后10%作为测试集。但是面对如此庞大的数据,还包括实验过程中要求每个用户的评分的平均时间、每个物品的评分的平均时间。这些涉及到大数据的预处理。本屌今年刚刚研一,没有数据挖掘的背景,也没有学过hadoop,实在想不出高效率的办法。希望大神能够相助

  • 写回答

0条回答 默认 最新

    报告相同问题?

    悬赏问题

    • ¥15 基于卷积神经网络的声纹识别
    • ¥15 Python中的request,如何使用ssr节点,通过代理requests网页。本人在泰国,需要用大陆ip才能玩网页游戏,合法合规。
    • ¥100 为什么这个恒流源电路不能恒流?
    • ¥15 有偿求跨组件数据流路径图
    • ¥15 写一个方法checkPerson,入参实体类Person,出参布尔值
    • ¥15 我想咨询一下路面纹理三维点云数据处理的一些问题,上传的坐标文件里是怎么对无序点进行编号的,以及xy坐标在处理的时候是进行整体模型分片处理的吗
    • ¥15 CSAPPattacklab
    • ¥15 一直显示正在等待HID—ISP
    • ¥15 Python turtle 画图
    • ¥15 stm32开发clion时遇到的编译问题