猫的歪 2014-12-17 13:14
浏览 1289

基于时间的矩阵分解模型,如何chulinetflix数据集

我在根据项亮著作《推荐系统实践》第八章中的加入时间的矩阵分解模型做实验时,也就是timeSVD++。但是我遇到的问题是:数据集(2007年netflix比赛数据)如何处理。书上写的是把用户的评分时间从早到晚排序,取前90%作为训练集,后10%作为测试集。但是面对如此庞大的数据,还包括实验过程中要求每个用户的评分的平均时间、每个物品的评分的平均时间。这些涉及到大数据的预处理。本屌今年刚刚研一,没有数据挖掘的背景,也没有学过hadoop,实在想不出高效率的办法。希望大神能够相助

  • 写回答

0条回答

    报告相同问题?

    悬赏问题

    • ¥100 求数学坐标画圆以及直线的算法
    • ¥100 c语言,请帮蒟蒻写一个题的范例作参考
    • ¥15 名为“Product”的列已属于此 DataTable
    • ¥15 安卓adb backup备份应用数据失败
    • ¥15 eclipse运行项目时遇到的问题
    • ¥15 关于#c##的问题:最近需要用CAT工具Trados进行一些开发
    • ¥15 南大pa1 小游戏没有界面,并且报了如下错误,尝试过换显卡驱动,但是好像不行
    • ¥15 自己瞎改改,结果现在又运行不了了
    • ¥15 链式存储应该如何解决
    • ¥15 没有证书,nginx怎么反向代理到只能接受https的公网网站