欧氏距离电影推荐算法

怎样把给所有用户推荐的电影都保存起来？


import pandas as pd
from math import *
import numpy as np

"""
读取movies文件，设置列名为’videoId', 'title', 'genres'
读取ratings文件，设置列名为'userId', 'movieId', 'rating', 'timestamp'
通过两数据框之间的 videoId 连接
保存'userId', 'rating', 'movieId', 'title'为data数据表
"""
movies = pd.read_csv("D:/Datamovies/ml-latest-small/movies.csv", names=['movieId', 'title', 'genres'])
ratings = pd.read_csv("D:/Datamovies/ml-latest-small/ratings.csv",names=['userId', 'movieId', 'rating', 'timestamp'])
data = pd.merge(movies, ratings, on='movieId')
data[['userId', 'rating', 'movieId', 'title']].sort_values('userId').to_csv('D:/Datamovies/ml-latest-small/data.csv',index=False)
 
"""
新建一个data字典存放每位用户评论的电影和评分, 如果字典中没有某位用户，则使用用户ID来创建这位用户,否则直接添加以该用户ID为key字典中
"""
file = open("D:/Datamovies/ml-latest-small/data.csv",'r', encoding='UTF-8')
data = {}
for line in file.readlines():
    line = line.strip().split(',')
    if not line[0] in data.keys():
        data[line[0]] = {line[3]:line[1]}
    else:
        data[line[0]][line[3]] = line[1]
 
 
"""
找到两位用户共同评论过的电影,然后计算两者之间的欧式距离，最后算出两者之间的相似度，欧式距离越小两者越相似
"""
def Euclidean(user1, user2):
    user1_data = data[user1]
    user2_data = data[user2]
    distance = 0
    for key in user1_data.keys():
        if key in user2_data.keys():
           distance += pow(float(user1_data[key]) - float(user2_data[key]), 2)
 
    return 1 / (1 + sqrt(distance))
 
"""
计算某个用户与其他用户的相似度
"""
def top_simliar(userID):
    res = []
    for userid in data.keys():
        # 排除与自己计算相似度
        if not userid == userID :
            simliar = Euclidean(userID, userid)
            res.append((userid, simliar))
    res.sort(key=lambda val: val[1])
    return res[:4]
 
"""
从控制台输入需要推荐的用户ID，如果用户不在原始数据集中则报错，重新输入
"""
getIdFlag = 0
while not getIdFlag:
    inputUid = str(input("请输入用户ID\n"))
    try:
        uid = data[inputUid]
        getIdFlag = 1
    except Exception:
        print("用户ID错误，请重新输入\n")
 
 
"""
根据与当前用户相似度最高的用户评分记录，按降序排列，推荐出改用户还未观看的评分最高的10部电影
"""
def recommend(user):
    top_sim_user = top_simliar(user)[0][0]
    items = data[top_sim_user]
    recommendations = []
    for item in items.keys():
        if item not in data[user].keys():
            recommendations.append((item, items[item]))
    recommendations.sort(key=lambda val: val[1], reverse=True)  # 按照评分排序
    return recommendations[:10]
 
"""
根据输入的用户ID，输出为他推荐的影片
"""
Recommendations = recommend(inputUid)
print("为用户" + inputUid + "推荐下列评分最高的十部影片\n")
for video in Recommendations:
    print(video)

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
檀越@新空间 2024-03-18 19:47
关注
m0_56062032 晚上好🌙🌙🌙
本答案参考ChatGPT-3.5

根据你的需求，保存给所有用户推荐的电影可以通过以下步骤实现：

在代码中，已经将给用户推荐的电影保存在了一个名为recommendations的变量中。可以使用该变量将推荐结果保存到一个新的数据结构或者文件中。

选择合适的数据结构。根据需要，可以选择将推荐结果保存到列表、字典或者数据表等数据结构中。比较常用的选择是将结果保存到一个名为recommendations的字典中，其中键为用户ID，值为推荐的电影列表。

将推荐结果保存到字典中。在recommend函数中，可以使用一个新的字典来存储推荐结果。在每次循环中，将用户ID作为键，推荐的电影列表作为值，并将该键值对添加到字典中。

保存字典到文件中。可以使用Python的文件操作函数，例如open和write，将推荐结果保存到一个文本文件或者CSV文件中。

以下是修改后的代码示例，展示了如何将推荐结果保存到一个字典，并将字典保存到一个文本文件中：

# 新建一个空字典来保存推荐结果 recommendations_dict = {} # 从控制台输入需要推荐的用户ID，如果用户不在原始数据集中则报错，重新输入 getIdFlag = 0 while not getIdFlag: inputUid = str(input("请输入用户ID\n")) try: uid = data[inputUid] getIdFlag = 1 except Exception: print("用户ID错误，请重新输入\n") # 根据输入的用户ID，进行推荐 recommendations = recommend(inputUid) # 将推荐结果保存到字典中 recommendations_dict[inputUid] = recommendations # 将推荐结果字典保存到文件中 with open("recommendations.txt", "w") as file: for user, movies in recommendations_dict.items(): file.write(f"用户{user}的推荐电影：\n") for movie in movies: file.write(f"电影ID: {movie[0]}, 评分: {movie[1]}\n") print("推荐结果已保存到recommendations.txt文件中")

请注意，以上是一种简单的实现方法，具体的数据结构和保存方式可以根据实际需求进行调整。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

数据挖掘-基于用户的协同过滤算法实现电影推荐-皮尔逊系数和欧氏距离
2021-11-18 15:17

数据挖掘在IT行业中扮演着重要角色，特别是在个性化推荐系统中，如电影推荐。基于用户的协同过滤算法是这类系统中常用的一种方法。这个压缩包文件"z69002"可能包含了一个Python实现，用于计算用户之间的相似度，并...
【推荐算法】混合推荐系统算法
2024-10-11 18:23

大雨淅淅的博客混合推荐系统算法是一种结合了多种推荐技术的推荐系统，旨在克服单一推荐方法的局限性，提高推荐的准确性和用户满意度。它通常将不同的推荐策略，如基于内容的推荐、协同过滤以及基于模型的方法等，以不同的方式结合...
经典推荐算法（基于内容的推荐算法）
2022-10-08 21:36

Rich Sniper的博客基于内容的推荐算法简介
机器学习：推荐算法
2025-04-22 20:22

码记大虾的博客要求：了解推荐算法的基本概念掌握推荐算法的类别掌握基于协调过滤的推荐算法了解其他常见的推荐算法。
构建推荐系统的相似检索技术：从距离度量到深度学习的快速了解
2023-11-04 01:18

张彦峰ZYF的博客相似检索方法是一种用于从大量数据中找到与查询数据相似的数据项的技术。这种方法通常用于信息检索、推荐系统、图像处理、自然语言处理等领域。相似检索主要方法可以总体分为以下几类：这些方法各自有其适用的场景和...
十七、机器学习进阶知识：推荐算法
2023-12-18 17:00

七层楼的疯子的博客主要从推荐算法的相关概念、协同过滤推荐算法以及基于内容的推荐算法这三个部分展开介绍，其中协同过滤推荐算法分别对基于用户以及基于用品这两种进行展开说明，而基于内容则是结合具体的实例进行说明。
推荐算法（基于用户/物品的协同过滤算法）
2024-11-21 20:10

吸嘎嘎能手的博客信息过载的时代。信息消费者面临的问题是如何收集到自己感兴趣的信息。对于信息生产者来说，高效地把信息推送给感...推荐流程示意：推荐系统首先收集、处理客户的数据，通过分析客户的特征，为客户推荐最合适的商品。
Python机器学习机器学习十大算法英文文档kNN
2024-04-15 16:01

8. Python实现：在Python中实现kNN算法，常用的数据结构是距离列表或距离矩阵，利用Python的内置函数和库，如NumPy和Scikit-learn，可以方便地实现kNN算法，并对k值进行优化，最终用于数据的预测和分类任务。...
【推荐算法】协同过滤推荐算法
2024-10-13 22:19

大雨淅淅的博客协同过滤推荐算法是一种基于用户历史行为数据的推荐方法，它在个性化推荐领域扮演着至关重要的角色。这种算法主要分为两种类型：用户基于协同过滤和物品基于协同过滤。用户基于协同过滤关注的是寻找与目标用户具有...
【机器学习 | 数据挖掘】智能推荐算法
2024-12-28 09:00

Francek Chen的博客本文首先介绍了智能推荐的概念、应用、评价指标，然后讲解了智能推荐常见的关联规则算法，包括Apriori和FP-Growth，最后讲解常见的协同过滤推荐技术，包括基于用户的协同过滤推荐和基于物品的协同过滤推荐。
基于Jaccard相似度的推荐算法---示例
2023-11-03 14:49

一只天蝎的博客【代码】基于Jaccard相似度的推荐算法---示例。
推荐系统（6）：推荐算法之基于内容的推荐算法
2022-05-14 20:29

电光闪烁的博客 1. 什么是基于内容的推荐算法 2. 基于内容的推荐算法举例 3. 基于内容的推荐算法总结 4. 相似度计算 5. 基于内容推荐系统的高层次结构 6. 基于UGC的推荐 7. 基于UGC简单推荐的问题 8. 基于TF-IDF的推荐 9. ...
python内容推荐算法_推荐算法入门-python
2020-11-27 23:33

weixin_39568706的博客下面以电影推荐为例：一、原始数据处理：原始数据为二维矩阵：行是用户，列是电影：Lady in the WaterSnakes on a PlaneJust My LuckSuperman ReturnsYou, Me and DupreeThe Night ListenerLisa Rose2.53.53....
推荐系统_（一）算法详解
2022-10-13 21:48

禁筱的博客常见的推荐算法
K近邻算法（KNN）的概述与实现
2024-10-20 14:10

sewinger的博客 KNN是一种简单但功能强大的算法，适用于分类和回归任务。然而，其计算成本和对K值的敏感性使其在处理大规模数据集或高维数据时存在一定的局限性。随着数据规模的增加，优化KNN的计算速度和性能成为一个值得探索的...
协同过滤算法
2024-06-19 16:09

北宸墨染的博客协同过滤算法是推荐系统中的一种经典方法，它通过分析用户的历史行为数据来预测用户可能感兴趣的物品。协同过滤算法主要分为两种类型：基于用户的协同过滤（User-based Collaborative Filtering, UCF）和基于物品的...
简易推荐算法
2020-05-19 19:12

ZPeng_Yan的博客 推荐算法的研究起源于20世纪90年代，由美国明尼苏达大学 GroupLens研究小组最先开始研究，他们想要制作一个名为 Movielens的电影推荐系统，从而实现对用户进行电影的个性化推荐。首先研究小组让用户对自己看过的...
SDU数据仓库与数据挖掘重要算法提纲
2022-06-01 04:16

feilongzzz的博客数据仓库与数据挖掘复习提纲
推荐算法的介绍以及实现一个简单的推荐算法(python实现协同过滤)
2020-05-19 23:18

rennan…的博客 推荐算法的研究起源于20世纪90年代，由美国明尼苏达大学 GroupLens研究小组最先开始研究，他们想要制作一个名为 Movielens的电影推荐系统，从而实现对用户进行电影的个性化推荐。首先研究小组让用户对自己看过的...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月18日

欧氏距离电影推荐算法

3条回答 默认 最新

问题事件

3条回答默认最新