钦笙 2022-10-19 22:34 采纳率: 87.5%
浏览 36
已结题

两种代码都有错误,求改正

#第一次使用建表地址,错误提示:invalid literal for int() with base 10: 
import pandas as pd
df = pd.read_excel('D:\笙笙\新建 XLSX 工作表.xlsx')
pairs = []
for i in range(len(df)):
    actors = df.at[i,'演员'].split(',')
    for actor in actors:
        pair = (actor,df.at[i,'电影名称'])
        pairs.append(pair)
pairs = sorted(pairs,key= lambda item:int(item[0][2:]))
index = [item[0]for item in pairs]
data = [item[1]for item in pairs]
df1 = pd.DataFrame({'演员':index,'电影名称':data})
result = df1.groupby('演员',as_index=False).count()
result.columns = ['演员','参演电影数量']
result.nlargest(3,'参演电影数量')

'''第二次将建表写入代码中,错误提示:
File "<ipython-input-67-93b3c74be99f>", line 4
    电影名称 导演 演员
    ^
IndentationError: unexpected indent'''
import pandas as pd
df = pd.read_excel('D:\笙笙\新建 XLSX 工作表.xlsx')
df
  电影名称 导演 演员
1 电影1 导演1 演员1,演员2,演员3,演员4
2 电影2 导演3 演员1,演员4,演员7,演员14
3 电影3 导演5 演员2,演员6,演员1,演员8
4 电影4 导演3 演员3,演员6,演员9,演员10
5 电影5 导演6 演员4,演员1,演员5,演员7
6 电影6 导演6 演员11,演员5,演员13,演员16
7 电影7 导演2 演员12,演员15,演员3,演员8
8 电影8 导演5 演员15,演员13,演员17,演员14
9 电影9 导演4 演员2,演员7,演员9,演员6
10 电影10 导演7 演员1,演员2,演员6,演员7
11 电影11 导演8 演员2,演员14,演员15,演员8
12 电影12 导演6 演员13,演员15,演员16,演员7
13 电影13 导演3 演员6,演员7,演员10,演员8
14 电影14 导演5 演员14,演员2,演员3,演员6
15 电影15 导演2 演员1,演员5,演员8,演员9
16 电影16 导演6 演员2,演员3,演员7,演员5
17 电影17 导演4 演员18,演员11,演员10,演员3
18 电影18 导演3 演员16,演员12,演员13,演员4
19 电影19 导演7 演员3,演员2,演员7,演员12

pairs = []
for i in range(len(df)):
    actors = df.at[i,'演员'].split(',')
    for actor in actors:
        pair = (actor,df.at[i,'电影名称'])
        pairs.append(pair)
pairs = sorted(pairs,key= lambda item:int(item[0][2:]))
index = [item[0]for item in pairs]
data = [item[1]for item in pairs]
df1 = pd.DataFrame({'演员':index,'电影名称':data})
result = df1.groupby('演员',as_index=False).count()
result.columns = ['演员','参演电影数量']
result.nlargest(3,'参演电影数量')

  • 写回答

1条回答 默认 最新

  • 怀念不必想念 2022-10-20 11:17
    关注

    演员表格拆解合并不正确,并没有拆解成数组,还是字符串,导致后续取pairs = sorted(pairs,key= lambda item:int(item[0][2:]))时候取得是字符串

    img

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 10月28日
  • 已采纳回答 10月20日
  • 创建了问题 10月19日

悬赏问题

  • ¥15 装 pytorch 的时候出了好多问题,遇到这种情况怎么处理?
  • ¥20 IOS游览器某宝手机网页版自动立即购买JavaScript脚本
  • ¥15 手机接入宽带网线,如何释放宽带全部速度
  • ¥30 关于#r语言#的问题:如何对R语言中mfgarch包中构建的garch-midas模型进行样本内长期波动率预测和样本外长期波动率预测
  • ¥15 ETLCloud 处理json多层级问题
  • ¥15 matlab中使用gurobi时报错
  • ¥15 这个主板怎么能扩出一两个sata口
  • ¥15 不是,这到底错哪儿了😭
  • ¥15 2020长安杯与连接网探
  • ¥15 关于#matlab#的问题:在模糊控制器中选出线路信息,在simulink中根据线路信息生成速度时间目标曲线(初速度为20m/s,15秒后减为0的速度时间图像)我想问线路信息是什么