#第一次使用建表地址,错误提示:invalid literal for int() with base 10:
import pandas as pd
df = pd.read_excel('D:\笙笙\新建 XLSX 工作表.xlsx')
pairs = []
for i in range(len(df)):
actors = df.at[i,'演员'].split(',')
for actor in actors:
pair = (actor,df.at[i,'电影名称'])
pairs.append(pair)
pairs = sorted(pairs,key= lambda item:int(item[0][2:]))
index = [item[0]for item in pairs]
data = [item[1]for item in pairs]
df1 = pd.DataFrame({'演员':index,'电影名称':data})
result = df1.groupby('演员',as_index=False).count()
result.columns = ['演员','参演电影数量']
result.nlargest(3,'参演电影数量')
'''第二次将建表写入代码中,错误提示:
File "<ipython-input-67-93b3c74be99f>", line 4
电影名称 导演 演员
^
IndentationError: unexpected indent'''
import pandas as pd
df = pd.read_excel('D:\笙笙\新建 XLSX 工作表.xlsx')
df
电影名称 导演 演员
1 电影1 导演1 演员1,演员2,演员3,演员4
2 电影2 导演3 演员1,演员4,演员7,演员14
3 电影3 导演5 演员2,演员6,演员1,演员8
4 电影4 导演3 演员3,演员6,演员9,演员10
5 电影5 导演6 演员4,演员1,演员5,演员7
6 电影6 导演6 演员11,演员5,演员13,演员16
7 电影7 导演2 演员12,演员15,演员3,演员8
8 电影8 导演5 演员15,演员13,演员17,演员14
9 电影9 导演4 演员2,演员7,演员9,演员6
10 电影10 导演7 演员1,演员2,演员6,演员7
11 电影11 导演8 演员2,演员14,演员15,演员8
12 电影12 导演6 演员13,演员15,演员16,演员7
13 电影13 导演3 演员6,演员7,演员10,演员8
14 电影14 导演5 演员14,演员2,演员3,演员6
15 电影15 导演2 演员1,演员5,演员8,演员9
16 电影16 导演6 演员2,演员3,演员7,演员5
17 电影17 导演4 演员18,演员11,演员10,演员3
18 电影18 导演3 演员16,演员12,演员13,演员4
19 电影19 导演7 演员3,演员2,演员7,演员12
pairs = []
for i in range(len(df)):
actors = df.at[i,'演员'].split(',')
for actor in actors:
pair = (actor,df.at[i,'电影名称'])
pairs.append(pair)
pairs = sorted(pairs,key= lambda item:int(item[0][2:]))
index = [item[0]for item in pairs]
data = [item[1]for item in pairs]
df1 = pd.DataFrame({'演员':index,'电影名称':data})
result = df1.groupby('演员',as_index=False).count()
result.columns = ['演员','参演电影数量']
result.nlargest(3,'参演电影数量')