统计分析的电影推荐算法数据形状问题

基于统计分析的电影推荐算法数据形状的问题，ValueError: Shape of passed values is (1, 1), indices imply (1, 1614)
电影推荐算法代码

import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.metrics.pairwise import cosine_similarity
from sklearn.neighbors import NearestNeighbors
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import mean_squared_error
from sklearn.model_selection import cross_val_score
# 加载movielens 100K数据集
def load_movielens_data(path='D:/Datamovies/ml-100k/u1.base', test_size=0.2):
    # 读取用户和电影的元数据
    users_df = pd.read_csv(path, sep='\t', header=None, names=['user_id', 'movie_id', 'rating', 'timestamp'])
    
    # 分割数据集为训练集和测试集
    train, test = train_test_split(users_df, test_size=test_size, random_state=42)
    
    # 计算电影之间的相似度
    movie_similarity = cosine_similarity(train[['rating']].values.T)
    
    # 将相似度矩阵转化为DataFrame
    movie_similarity_df = pd.DataFrame(movie_similarity, columns=train['movie_id'].unique())
    
    return train, test, movie_similarity_df
# 推荐电影给用户
def recommend_movies(movie_similarity_df, user_id, num_recommendations=10):
    # 为当前用户找到最相似的用户
    similar_users = movie_similarity_df.apply(lambda x: x.corr(movie_similarity_df.iloc[user_id]))
    
    # 找到这些相似用户评分最高的电影
    recommended_movies = similar_users.nlargest(num_recommendations).index
    
    return recommended_movies
# 评估推荐系统的性能
def evaluate_performance(train, test, movie_similarity_df):
    # 标准化评分
    scaler = StandardScaler()
    train_scaled = scaler.fit_transform(train[['rating']])
    test_scaled = scaler.transform(test[['rating']])
    
    # 训练推荐模型
    model = NearestNeighbors(n_neighbors=10)
    model.fit(train_scaled)
    
    # 预测测试集
    predictions = model.kneighbors(test_scaled, return_distance=False)
    
    # 计算均方根误差
    rmse = mean_squared_error(test['rating'], predictions, squared=False)
    
    # 计算准确率和召回率
    # 这里我们假设我们推荐的列表中只有1个电影是被评分过的，这是简化的情况
    num_test_users = len(test)
    accurate_recalls = [1 if len(set(predictions[i]).intersection(set(train['movie_id'][train['user_id'] == test.iloc[i]['user_id']]))) > 0 else 0 for i in range(num_test_users)]
    total_recalls = [1 if len(set(predictions[i]).intersection(set(train['movie_id'][train['user_id'] == test.iloc[i]['user_id']]))) > 0 else 0 for i in range(num_test_users)]
    accuracy = sum(accurate_recalls) / num_test_users
    recall = sum(total_recalls) / num_test_users
    
    return rmse,accuracy,recall
# 执行推荐系统
def run_recommender_system(path='D:/Datamovies/ml-100k/u1.base', test_size=0.2):
    train, test, movie_similarity_df = load_movielens_data(path, test_size)
    
    # 输出电影推荐结果
    print(recommend_movies(movie_similarity_df, user_id=1))
    
    # 评估推荐系统性能
    print(evaluate_performance(train, test, movie_similarity_df))
run_recommender_system()

错误代码

ValueError                                Traceback (most recent call last)
~\AppData\Roaming\Python\Python36\site-packages\pandas\core\internals\managers.py in create_block_manager_from_blocks(blocks, axes)
   1670                 blocks = [
-> 1671                     make_block(values=blocks[0], placement=slice(0, len(axes[0])))
   1672                 ]

~\AppData\Roaming\Python\Python36\site-packages\pandas\core\internals\blocks.py in make_block(values, placement, klass, ndim, dtype)
   2743 
-> 2744     return klass(values, ndim=ndim, placement=placement)
   2745 

~\AppData\Roaming\Python\Python36\site-packages\pandas\core\internals\blocks.py in __init__(self, values, placement, ndim)
    130             raise ValueError(
--> 131                 f"Wrong number of items passed {len(self.values)}, "
    132                 f"placement implies {len(self.mgr_locs)}"

ValueError: Wrong number of items passed 1, placement implies 1614

During handling of the above exception, another exception occurred:

ValueError                                Traceback (most recent call last)
<ipython-input-9-a454d8d78675> in <module>()
     66     # 评估推荐系统性能
     67     print(evaluate_performance(train, test, movie_similarity_df))
---> 68 run_recommender_system()
     69 
     70 

<ipython-input-9-a454d8d78675> in run_recommender_system(path, test_size)
     59 # 执行推荐系统
     60 def run_recommender_system(path='D:/Datamovies/ml-100k/u1.base', test_size=0.2):
---> 61     train, test, movie_similarity_df = load_movielens_data(path, test_size)
     62 
     63     # 输出电影推荐结果

<ipython-input-9-a454d8d78675> in load_movielens_data(path, test_size)
     19 
     20     # 将相似度矩阵转化为DataFrame
---> 21     movie_similarity_df = pd.DataFrame(movie_similarity, columns=train['movie_id'].unique())
     22 
     23     return train, test, movie_similarity_df

~\AppData\Roaming\Python\Python36\site-packages\pandas\core\frame.py in __init__(self, data, index, columns, dtype, copy)
    495                 mgr = init_dict({data.name: data}, index, columns, dtype=dtype)
    496             else:
--> 497                 mgr = init_ndarray(data, index, columns, dtype=dtype, copy=copy)
    498 
    499         # For data is list-like, or Iterable (will consume into list)

~\AppData\Roaming\Python\Python36\site-packages\pandas\core\internals\construction.py in init_ndarray(values, index, columns, dtype, copy)
    232         block_values = [values]
    233 
--> 234     return create_block_manager_from_blocks(block_values, [columns, index])
    235 
    236 

~\AppData\Roaming\Python\Python36\site-packages\pandas\core\internals\managers.py in create_block_manager_from_blocks(blocks, axes)
   1679         blocks = [getattr(b, "values", b) for b in blocks]
   1680         tot_items = sum(b.shape[0] for b in blocks)
-> 1681         raise construction_error(tot_items, blocks[0].shape[1:], axes, e)
   1682 
   1683 

ValueError: Shape of passed values is (1, 1), indices imply (1, 1614)

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-皆知 2024-05-11 10:53
关注
检查并确保输入数据与索引形状一致。

以上回复有部分引自免费微信小程序：皆我百晓生。如问题尚未解决，还请稍待，如有疑问请回复进一步沟通。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

数据产品视频领域：内容理解与智能推荐算法
2025-09-06 10:43

AI量化价值投资入门到精通的博客你知道吗？2023年中国短视频用户规模超过10亿...视频内容理解的完整流程（从视频到标签）、智能推荐的三大算法（协同过滤、内容基于、混合推荐）、实战代码实现（用Python做一个小推荐系统），以及实际应用和未来挑战。
数据挖掘算法与应用（一）
2025-02-26 16:56

愚戏师的博客数据挖掘算法与应用
Movielens数据集与Apriori算法在电影推荐系统中的应用
2025-08-10 14:19

赵子诺的博客它不仅是评估推荐算法性能的重要基准，也是进行探索性数据分析和实践机器学习技术的优良工具。Movielens 100K数据集的发布，为广大的研究者提供了一个标准化的测试环境，促进了推荐系统算法的比较与创新。数据集不仅...
大数据领域数据工程的智能数据挖掘算法
2025-09-28 16:33

AI Python 编程的博客数据工程（Data Engineering）：构建数据管道的过程，负责将原始数据（比如用户点击日志、传感器数据）转化为可分析的结构化数据。主要环节包括：数据采集（从数据库、日志文件获取数据）、数据存储（用Hadoop、...
（12-3-02）动漫推荐系统：数据分析（2）
2024-04-06 09:14

码农三叔的博客 pd.merge(anime, rating, on="anime_id", suffixes=[None, "_user"])：使用 Pandas 的 merge 方法，通过 "anime_id" 列将两个数据集进行连接，suffixes 参数指定了在列名相同时添加的后缀。（1）下面的代码执行了两...
推荐算法之:GBDT、GBDT LR、XGBoost详细解读与案例实现
2025-11-22 10:21

zhishidi的博客 GBDT是一种集成学习方法，通过多轮迭代逐步修正...代码示例展示了如何使用GBDT+LR模型进行商品推荐，包括数据生成、特征转换和模型训练流程。这种组合方法既保留了GBDT的特征组合能力，又发挥了LR处理稀疏特征的优势。
Python数据分析-Netflix数据分析和可视化
2024-11-04 09:00

statistican_ABin的博客 Python数据分析-Netflix数据分析和可视化
2025-2026 年算法方向毕业设计题目大全：热门方向与选题推荐
2025-09-26 17:49

Mini_hailang_IT的博客大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学做准备,一边要为毕业设计耗费大量...最新最全计算机专业毕设选题精选推荐汇总大家好,这里是海浪学长计算机毕设专题,本次分享的课题是算法。
基于大数据爬虫数据挖掘技术+Python的线上招聘信息分析统计与可视化平台(源码+论文+PPT+部署文档教程等)
2024-10-11 23:03

java李杨勇的博客基于数据挖掘技术的线上招聘信息分析系统旨在通过应用先进的数据分析方法，为求职者和招聘者提供更加高效、精准的招聘服务。该系统具备强大的信息处理能力，能够从海量的招聘数据中提取有价值的信息，揭示市场趋势和...
2024史上最全大数据分析和人工智能科普
2024-09-09 20:33

脚步的影子的博客希望我们都能成为“人生硬核玩家”完结31周AI人工智能算法工程师资源-CSDN文库 https://download.csdn.net/download/aidedmniy/89658251?
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月11日

统计分析的电影推荐算法数据形状问题

3条回答 默认 最新

问题事件

3条回答默认最新