pandas处理表格数据获得新表格

处理这张表格（图是网上保存的）

想获得这样一个新表格：

演员甲参演电影1 参演电影2 参演电影3 …
演员乙参演电影1 参演电影2 参演电影3 …
演员丙参演电影1 参演电影2 参演电影3 …
…

请问该怎么写代码，谢谢大佬们的解答！

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

学海无涯回头已晚 2022-01-11 11:47

关注


import pandas as pd

# 创建一个DataFrame作为新表数据
df = pd.DataFrame(data={
    'Actors': [],
    'Movie1': [],
})
# 读取Excel文件
excel = pd.read_excel('TMDB-Movie-Data.xlsx')

# 遍历Actors列
for index, row in excel['Actors'].iteritems():
    actors = row.split('，')  # 按“，”拆分Actors
    for item in actors:

        # 判断当前Actor是否已经在 df 里
        if item in df['Actors'].tolist():
            row = df.loc[df['Actors'] == item]  # 得到当前Actor在df中的行
            a = 1
            # 判断当前Actor参演的电影记录到了哪一列
            try:
                while not pd.isnull(df.loc[row.index[0], 'Movie' + str(a)]):
                    a += 1
            except KeyError:
                pass
            # 在当前Actor所在的行末尾增加一个参演的电影
            df.loc[row.index[0], 'Movie' + str(a)] = excel['Title'][index]
        else:
            # 如果当前的Actor没有记录在df里，则新增
            df = df.append({
                'Actors': item,
                'Movie1': excel['Title'][index]
            }, ignore_index=True)

# 将df保存到新表里
df.to_excel('result.xlsx', index=False)

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(1条)

报告相同问题？

关注问题

Python基于pandas爬取网页表格数据
2020-12-17 13:56

在Python的编程环境中，pandas库是一个非常强大的数据分析工具，同时也提供了一种便捷的方式来爬取网页中的表格数据。本文将详细介绍如何使用pandas的`read_html`函数来抓取网页表格，以及一些相关的参数和使用技巧...
Python之pandas表格处理常用方法
2024-09-05 12:28

whY的笔记的博客还可以换成：last()即最后一个数据作为填充，,ffill(),bfill()等详见：python中Pandas的简单实例应用/resample函数/pivot_table函数/时间序列/使用数据透视和重采样从股指成分股进出记录得到月频的股指成分股数据_...
python不用pandas处理表格数据_使用python处理excel表格——pandas（1）
2021-03-05 19:02

狠茬子嘻嘻的博客一.基本概念excel文件打开之后，该文件叫工作簿(workbook)。每个工作簿中包含多张表单(worksheet),正在操作的表单被成为活跃的表单(active worksheet)。每一张表单中，有行(row)，列...创建空表格import pandas ...
【python】Pandas处理Excel表格用法分析与最佳实践
2024-08-08 14:14

景天科技苑的博客 Pandas是Python中一个非常强大的数据处理库，它提供了快速、灵活和表达式丰富的数据结构，旨在使“关系”或“标签”数据的处理工作变得既简单又直观。在处理Excel数据时，Pandas的read_excel函数及其后续的数据处理...
Python利用pandas处理Excel数据的应用详解
2020-12-26 03:31

最近迷上了高效处理数据的pandas，其实这个是用来做数据分析的，如果你是做大数据分析和测试的，那么这个是非常的有用的！！但是其实我们平时在做自动化测试的时候，如果涉及到数据的读取和存储，那么而利用pandas就...
基于Python和HTML的pandas数据处理与分析设计源码
2025-02-13 06:41

结合Python后端，如Flask或Django框架，用户可以通过浏览器访问这些HTML页面，并通过前端提交数据或请求，后端再利用pandas处理数据并反馈结果。在本项目中，还提供了2个Jupyter笔记本。Jupyter Notebook是一个...
Python用pandas处理excel表格数据
2024-05-30 10:56

图灵学者的博客如果没有panda请先安装，pandas能处理多种格式文件，处理excel表格的时候，无所谓是不是.xls还是.xlsx
【 Python高级编程】Pythonz中Pandas表格读取与数据处理
2024-06-16 17:15

烛龙的博客通过本文的介绍，您了解了如何使用 Pandas 读取表格数据并进行基本的数据处理操作。Pandas 提供了丰富的功能，使得数据处理和分析变得简单高效。希望这些内容能帮助您更好地掌握 Pandas，提升数据处理能力。
Python数据分析实战：Pandas高效处理Excel数据指南
2025-05-21 15:54

傻啦嘿哟的博客将80%的时间从重复操作中解放轻松处理百万行级数据构建自动化分析流水线未来随着Dask、Modin等库的发展，Pandas生态将持续突破单机性能瓶颈，真正实现"Excel进阶，Python赋能"的数据分析新时代。
基于Python快速处理PDF表格数据
2020-09-16 18:44

在Python编程环境中，处理PDF表格数据是一项常见的任务，特别是在数据分析和报告自动化中。本文主要讨论如何使用Python的`pdfplumber`库来高效地提取和转换PDF中的表格数据。`pdfplumber`是一个轻量级的库，专门用于...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 1月20日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 1月12日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月11日

pandas处理表格数据获得新表格

2条回答 默认 最新

问题事件

2条回答默认最新