TensorFlow电影推荐评估准确率

怎样计算这个准确率，召回率和F1呢？


import pandas as pd
import numpy as np
import tensorflow as tf
ratings_df = pd.read_csv('D:/Datamovies/ml-latest-small/ratings.csv')
ratings_df.tail()
movies_df = pd.read_csv('D:/Datamovies/ml-latest-small/movies.csv')
movies_df['movieRow'] = movies_df.index #添加电影行数
ratings_df.tail()
movies_df.tail()
movies_df = movies_df[['movieRow','movieId','title']]
movies_df.to_csv('D:/Datamovies/ml-25min/moviesProcessed.csv',index = False,header = True,encoding = 'utf-8')
ratings_df = pd.merge(ratings_df,movies_df,on = 'movieId')
ratings_df = ratings_df[['userId','movieRow','rating']]
ratings_df.to_csv('D:/Datamovies/ml-25min/ratingsProcessed.csv',index = False,header = True,encoding = 'utf-8')
userNo = ratings_df['userId'].max()+1
movieNo = ratings_df['movieRow'].max()+1
rating = np.zeros((movieNo,userNo))
flag = 0 #记录处理进度
ratings_df_length = np.shape(ratings_df)[0]
for index,row in ratings_df.iterrows():#获取ratings_df的每一行
        rating[int(row['movieRow']),int(row['userId'])] = row['rating']
        flag += 1 #表示处理完一行
        print('processed %d,%d left'%(flag,ratings_df_length-flag))
#将构建record矩阵并将矩阵中的Boolean值改成相应的数值
record = rating>0 
record = np.array(record,dtype = int)
record
def normalizeRatings(rating,record):#缩放评分矩阵范围
    m,n = rating.shape#m为电影数量，n为用户数量
    rating_mean = np.zeros((m,1))#初始化电影评分平均值为0
    rating_norm = np.zeros((m,n))#保存处理后的数据
    for i in range(m):
        idx = record[i,:] != 0 #获取每部电影评分用户的下标，每部电影的评分
        rating_mean[i] = np.mean(rating[i,idx])#表示第i行已经评过分的用户的平均值
        rating_norm[i,idx] -= rating_mean[i]
    return rating_norm,rating_mean
tf.compat.v1.disable_eager_execution()

rating_norm,rating_mean = normalizeRatings(rating,record) #由于数据中的某些行有这里会出现警告
#处理nan
rating_norm = np.nan_to_num(rating_norm)
rating_mean = np.nan_to_num(rating_mean)
#假设一共有10类电影
num_features = 10
#初始化电影内容矩阵和用户喜好矩阵，产生的参数都是随机数并且是正态分布的
X_parameters = tf.Variable(tf.random.normal([movieNo,num_features],stddev = 0.35))
Theta_parameters = tf.Variable(tf.random.normal([userNo,num_features],stddev = 0.35))
# 构建损失函数
loss = 1/2 * tf.reduce_sum(((tf.matmul(X_parameters,Theta_parameters,transpose_b = True)- rating_norm)*record)**2)+ 1/2 *(tf.reduce_sum(X_parameters**2) + tf.reduce_sum(Theta_parameters**2))
#将X_parameters，Theta_parameters矩阵相乘相乘之前将Theta_parameters转置
#创建优化器和优化目标
optimizer = tf.compat.v1.train.AdamOptimizer(1e-4)
train = optimizer.minimize(loss)
#tf.summary.scalar('loss',loss)
loss_summary = tf.compat.v1.summary.scalar('loss', loss)
summaryMerged =tf.compat.v1.summary.merge_all()
with tf.compat.v1.Session() as sess:
    sess.run(tf.compat.v1.global_variables_initializer())
    filename = 'D:/Datamovies/ml-25min/movie_tensorboard'
    writer = tf.summary.create_file_writer(filename)
    for i in range(50):
        _,movie_summary = sess.run([train,loss_summary])
        #writer.add_summary(movie_summary, i)
        with writer.as_default():
            tf.summary.scalar('loss', movie_summary, step=i)
            writer.flush()
with tf.compat.v1.Session() as sess:
    sess.run(tf.compat.v1.global_variables_initializer())
    Current_X_parameters,Current_Theta_parameters = sess.run([X_parameters,Theta_parameters])
predicts = np.dot(Current_X_parameters,Current_Theta_parameters.T)+rating_mean
errors = np.sqrt(np.sum(predicts-rating)%2)
print(u'模型评估errors：', errors)
user_id = input('请输入要推荐的用户编号：')
user_id = int(user_id)
sortedResult = predicts[:,user_id].argsort()[::-1]#获取该用户的电影评分列表
print('为该用户提供的推荐列表：'.center(80,'='))
idx =0
for i in sortedResult:
    print('评分：%.2f,电影名：%s'%(predicts[i,int(user_id)],movies_df.iloc[i]['title']))
    idx +=1
    if idx == 20:
        break

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
檀越@新空间 2024-03-14 14:19
关注
m0_56062032 下午好🌅🌅🌅
本答案参考ChatGPT-3.5

计算准确率（Accuracy），召回率（Recall）和F1值，可以按照以下步骤进行：

首先，根据实际评分和预测评分，将评分转换为二分类问题，即转换为用户是否喜欢该电影的预测问题。例如，将评分大于3的预测为1，表示用户喜欢该电影；将评分小于等于3的预测为0，表示用户不喜欢该电影。

根据上一步转换后的预测结果和实际结果，计算准确率（Accuracy），召回率（Recall）和F1值：

准确率（Accuracy）为分类正确的样本数除以总样本数。可使用sklearn库中的accuracy_score函数计算。
召回率（Recall）为正例被正确预测的样本数除以所有正例样本数。可使用sklearn库中的recall_score函数计算。
F1值（F1-score）为准确率和召回率的调和平均值，可以综合考虑准确率和召回率的性能。可使用sklearn库中的f1_score函数计算。

修改后的代码：

from sklearn.metrics import accuracy_score, recall_score, f1_score # 将预测评分转换为二分类问题 predicted_ratings = np.where(predicts > 3, 1, 0) # 将实际评分转换为二分类问题 actual_ratings = np.where(rating > 3, 1, 0) # 计算准确率 accuracy = accuracy_score(actual_ratings.flatten(), predicted_ratings.flatten()) # 计算召回率 recall = recall_score(actual_ratings.flatten(), predicted_ratings.flatten()) # 计算F1值 f1 = f1_score(actual_ratings.flatten(), predicted_ratings.flatten()) print("准确率：", accuracy) print("召回率：", recall) print("F1值：", f1)

以上代码中的actual_ratings.flatten()和predicted_ratings.flatten()用于将二维数组转换为一维数组，以便计算准确率、召回率和F1值。

解决方案总结：

将电影评分转换为二分类问题，根据评分阈值将评分大于阈值的预测为1，评分小于等于阈值的预测为0。
使用sklearn库中的accuracy_score函数计算准确率，recall_score函数计算召回率，f1_score函数计算F1值。
打印准确率、召回率和F1值。
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

基于python与TensorFlow的电影推荐系统设计与实现.docx
2023-10-26 11:26

第四章“系统评估与优化”介绍了常用的推荐系统评估指标，如准确率、召回率、覆盖率和多样性等。通过实验设计，对比不同推荐算法的效果，分析实验结果，提出优化策略，以提升推荐系统的性能和用户满意度。第五章...
基于深度学习的Python电影推荐系统源代码数据模型文件程序说明文档
2025-07-18 14:23

6. 模型评估：使用测试数据集对模型的推荐效果进行评估，常用的评估指标包括准确率、召回率、F1分数、平均绝对误差(MAE)等。在本篇文档中，我们将详细介绍如何使用Python语言和深度学习框架，如TensorFlow或...
推荐算法,推荐算法工程师需要掌握哪些知识,matlab
2021-09-10 17:27

还有**混合推荐系统(Hybrid Recommendation System)**，结合多种推荐策略，如协同过滤与基于内容的推荐，以提高推荐的准确性和覆盖率。在实际工程中，推荐算法的评估也是至关重要的，常见的评估指标包括**精度...
基于MovieLens-1M数据集实现的协同过滤算法demo
2023-04-08 07:03

评估推荐系统性能常用的指标有准确率、召回率、F1分数以及RMSE（均方根误差）、MAE（平均绝对误差）。在本项目中，可以使用交叉验证或留出法对模型进行评估，比较不同算法的预测效果。 **六、优化策略** 1. **稀疏...
一个电影推荐系统：项目是一个基于maven的混合语言项目，同时包含了TensorFlow，Spark，Jetty Server等推荐系统的不同模块
2024-12-12 11:59

通过设计合理的评估指标，比如准确率、召回率、F1分数等，能够对模型在未知数据上的表现进行客观评价。这一过程需要对模型进行严格的测试，以确保其在实际应用中的有效性。模型一旦通过评估，便可以部署到线上服务...
基于Python实现的个性化推荐算法源码.zip
2025-05-28 00:34

4. 推荐效果评估：为了验证模型的有效性，源码中应当提供了推荐效果评估的代码，使用如准确率、召回率、F1分数、ROC曲线下面积等指标来衡量模型性能。 5. 结果应用：推荐系统最终是要服务于用户的，源码中应该包含...
数据科学中的推荐系统：协同过滤算法详解
2025-09-06 12:07

AI 搜索引擎技术的博客基于记忆的近邻协同过滤（User-Based/Item-Based）基于模型的矩阵分解技术（传统SVD与改进版ALS）稀疏数据处理、相似度计算、冷启动优化等关键问题从理论推导到真实项目的完整落地路径背景与核心概念：定义协同过滤...
基于深度学习的电影推荐系统.zip
2025-04-11 23:02

为了实现这一目标，我们会采用高效的数据结构和算法，例如使用近似最近邻搜索算法来加速推荐过程。此外，为了处理大规模数据集，我们可能会利用分布式计算框架，例如Apache Spark或TensorFlow等，这些框架提供了自动...
使用TensorFlow框架来实现内容的个性化推荐
2025-01-19 17:52

eso1983的博客我们每天在看抖音、快手、京东等app时，都会根据算法和数据给我们推荐个性化的商品和内容。使用谷歌的TensorFlow框架就可以实现这里面大部分的底层逻辑。如果对这方面感兴趣，我建议可以按照以下几个方面开始学习。
【推荐系统原理与实践】协同过滤推荐算法、基于内容的推荐、深度学习、矩阵分解、嵌入层、注意力机制、优化算法等
2024-07-10 00:15

程序员光剑的博客它通过分析和挖掘用户的行为数据，为用户推荐他们可能感兴趣的商品、文章、音乐、视频等内容，极大地提升了用户的满意度和体验。推荐系统在电子商务、社交媒体、流媒体平台、新闻聚合网站等多个领域中发挥了重要作用...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 3月22日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月14日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月14日

TensorFlow电影推荐评估准确率

3条回答 默认 最新

问题事件

3条回答默认最新