基线baseline电影推荐算法

基线baseline电影推荐算法怎样求其AUC或NDCG？

import numpy as np
import pandas as pd
title=['user_id', 'item_id', 'rating', 'timestamp']
df = pd.read_csv("D:/Datamovies/ml-100k/u3.base",sep='\t',names = title)
test_df=pd.read_csv('D:/Datamovies/ml-100k/u3.test',sep='\t',names=title)
print (np.max(df['user_id']),np.max(df['item_id']))
ratings = np.zeros((943, 1682))
for row in df.itertuples():
    ratings[row[1]-1,row[2]-1] = row[3]
sparsity = float(len(ratings.nonzero()[0]))
sparsity /= (ratings.shape[0] * ratings.shape[1])
sparsity *= 100
print('训练集矩阵密度为: {:4.2f}%'.format(sparsity))
all_mean = np.mean(ratings[ratings!=0])
user_mean = sum(ratings.T)/sum((ratings!=0).T)
item_mean = sum(ratings)/sum((ratings!=0))
#用all_mean填充user_mean和item_mean可能存在的空值Nan
user_mean = np.where(np.isnan(user_mean), all_mean, user_mean)
item_mean = np.where(np.isnan(item_mean), all_mean, item_mean)
def predict_naive(user, item):
    prediction = item_mean[item] + user_mean[user] - all_mean
    return prediction
def rmse(pred, actual):
    '''计算预测结果的rmse'''
    from sklearn.metrics import mean_squared_error
    pred = pred[actual.nonzero()].flatten()
    actual = actual[actual.nonzero()].flatten()
    return np.sqrt(mean_squared_error(pred, actual))
# 用测试集测试
for row in test_df.itertuples():
    user,item,actual = row[1]-1,row[2]-1,row[3]
    predictions=[]
    predictions.append(predict_naive(user, item))
    actuals=[]
    actuals.append(actual)
print('测试结果的rmse为 %.4f' % rmse(np.array(predictions), np.array(actuals)))

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-皆知 2024-05-11 12:16
关注
使用sklearn.metrics库的相关函数，如roc_auc_score计算AUC，ndcg_score计算NDCG。

以上回复有部分引自免费微信小程序：皆我百晓生。如问题尚未解决，还请稍待，如有疑问请回复进一步沟通。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Android文字基线Baseline算法的使用讲解
2020-08-26 04:06

本文主要探讨的是Android中的文字基线（Baseline）算法及其在实际应用中的使用方法。首先，Baseline是绘制文字时的一个关键概念，它是衡量文字在垂直方向上的定位基准线。在Canvas上绘制文字时，必须明确文字的...
【推荐系统入门到项目实践】（四）：Baseline和Slope one算法
2022-11-03 08:00

JOJO数据科学的博客在上一篇文章中我们介绍了矩阵分解和ALS算法，上面这种方法的一个缺点是只使用了`个性化推荐`部分，没有考虑到物品和用户本身的整体情况。因此，下面介绍介绍两种用于反映一个整体情况推荐的方法。
styled-baseline:基线网格排版算法
2021-05-01 02:41

在网页设计中，良好的排版是提升用户体验的关键因素之一，而“styled-baseline: 基线网格排版算法”正是一种专注于优化排版的方法。它利用网格系统和垂直节奏来确保文本和元素在视觉上呈现出和谐、有序的布局。在本...
SOHU-baseline:搜狐校园算法大赛基线
2021-03-16 04:37

SOHU基准搜狐校园算法大赛基线代码运行环境： python 3.6 凯拉斯2.2.4 tqdm 界坝张量流-gpu 1.12.0整体思路：采用管道的方式，将这个任务拆为两个子任务，先预测方面，根据方面预测情感极性（ABSA），这两个子任务都...
Raman baseline:生物样品的拉曼基线校正算法-开源
2021-06-29 12:44

拉曼光谱是一种非破坏性的分子分析技术，它利用光与物质相互作用产生的散射现象来获取物质的化学和结构信息。在拉曼光谱中，入射光被分子散射，部分散射光的能量发生变化，形成所谓的"斯托克斯线"，即拉曼信号。然而...
android textview基线,Android文字基线（Baseline）算法
2021-06-05 03:39

weixin_39647499的博客引言Baseline是文字绘制时所参照的基准线只有先确定了Baseline的位置我们才能准确的将文字绘制在我们想要的位置上。Baseline的概念在我们使用TextView等系统控件直接设置文字内容时是用不到的但是如果我们想要在...
基于协同过滤算法的推荐系统设计.pdf
2022-05-30 16:32

【协同过滤算法】是推荐系统中的核心算法之一，它的基本思想是通过发现用户与用户、物品与物品之间的相似性，来预测用户可能对未评价物品的喜好，从而进行个性化推荐。协同过滤分为两种主要类型：基于用户的协同过滤...
Android文字基线Baseline算法的使用讲解(1)
2024-05-11 18:49

2401_84912197的博客自我介绍一下，小编13年上海交大毕业，曾经在小公司待过，也去过华为、OPPO等大厂，18年进入阿里一直到现在。深知大多数初中级Android工程师，想要提升技能，往往是自己摸索成长，自己不成体系的自学效果低效漫长且...
baseline_cor_boore.zip_baseline_基线修正程序
2022-07-15 01:48

标题中的"baseline_cor_boore.zip"表明这是一个与基线修正相关的软件或算法的压缩包，而"baseline_基线修正程序"进一步确认了这个主题。基线修正是一种常见的数据分析技术，特别是在信号处理、地震学、生物医学信号...
强化学习算法-基于python的reinforce算法实现
2022-06-02 23:05

此外，为了减少方差，`Reinforce`算法常常会结合一个称为“baseline”的值函数，它用来估计不采取任何特定动作时的期望奖励。这个值函数可以是简单的平均奖励，也可以是另一个神经网络模型。通过减去这个基线，我们...
强化学习PG和AC算法ppt讲解
2024-10-15 18:53

REINFORCE方法简单直观，但是它的方差较大，因此在实际应用中往往需要配合基线函数（baseline function）来降低方差。 Actor-Critic（AC）算法是PG算法的一个重要变种，它结合了策略梯度和价值函数的优势。在AC算法...
Android文字基线（Baseline）算法
2017-11-17 10:47

大海螺Utopia的博客引言Baseline是文字绘制时所参照的基准线，只有先确定了Baseline的位置，我们才能准确的将文字绘制在我们想要的位置上。Baseline的概念在我们使用TextView等系统控件直接设置文字内容时是用不到的，但是如果我们想要...
深度强化学习-带基线的策略梯度算法原理
2022-01-23 18:17

indigo love的博客本文主要介绍策略梯度算法的一种改进——带基线的策略梯度算法(Reinforce with baseline)。通过引入基线，有效降低了学习过程中的方差，从而提升训练过程的稳定性。 1 基线基线函数可以是任意随机函数或确定函数...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月11日

基线baseline电影推荐算法

4条回答 默认 最新

问题事件

4条回答默认最新