fbt_djh 2022-05-08 22:00 采纳率: 40%
浏览 52
已结题

python pandas DataFrame()合并数据的问题

当2个df中有多个相同列时,如何合并数据,我自己尝试写了下,但是跟需求有距离,求大家指点下

img

import pandas as pd
d1=[['一年级','1班','小明','一年级#1班#小明','及格'],
['一年级','1班','小宏','一年级#1班#小宏','不及格'],
['一年级','2班','小林','一年级#2班#小林','及格'],
['一年级','3班','小丽','一年级#3班#小丽','不及格'],
['二年级','1班','小米','二年级#1班#小米','及格']]


d2=[['一年级','1班','小张','一年级#1班#小张','不及格'],
['一年级','1班','小宏','一年级#1班#小宏','不及格'],
['一年级','2班','小林','一年级#2班#小林','及格'],
['一年级','3班','小丽','一年级#3班#小丽','不及格'],
['二年级','1班','小米','二年级#1班#小米','及格'],
['二年级','2班','小赵','二年级#2班#小赵','及格']]

df1=pd.DataFrame(d1,columns=['年级','班级','姓名','详细信息','期中成绩'])
df2=pd.DataFrame(d2,columns=['年级','班级','姓名','详细信息','期末成绩'])
temp1=df1.set_index(["详细信息"])
"""
此处不drop掉,合并的时候会有名称相同的错误,但是drop掉合并后,df2中这几个字段值就是空
"""
temp2=df2.drop(['年级','班级','姓名'],axis=1).set_index("详细信息")
result =temp2 .join(temp1, how="outer",sort=True,)

print(result.reset_index()[['年级','班级', '姓名', '详细信息','期中成绩','期末成绩']])

以上代码输出结果如下:未满足实际需求:

img

  • 写回答

2条回答 默认 最新

  • 皮卡搭皮卡丘 2022-05-09 16:21
    关注

    img


    pandas 提供了可以合并两张表的函数merge,带参数how="outer"是取来自左右的并集,匹配不到的话元素就会设为Null
    最后做个if判断就可再加一列总成绩

    import pandas as pd
    d1=[['一年级','1班','小明','一年级#1班#小明','及格'],
    ['一年级','1班','小宏','一年级#1班#小宏','不及格'],
    ['一年级','2班','小林','一年级#2班#小林','及格'],
    ['一年级','3班','小丽','一年级#3班#小丽','不及格'],
    ['二年级','1班','小米','二年级#1班#小米','及格']]
     
     
    d2=[['一年级','1班','小张','一年级#1班#小张','不及格'],
    ['一年级','1班','小宏','一年级#1班#小宏','不及格'],
    ['一年级','2班','小林','一年级#2班#小林','及格'],
    ['一年级','3班','小丽','一年级#3班#小丽','不及格'],
    ['二年级','1班','小米','二年级#1班#小米','及格'],
    ['二年级','2班','小赵','二年级#2班#小赵','及格']]
    
    df1=pd.DataFrame(d1,columns=['年级','班级','姓名','详细信息','期中成绩'])
    df2=pd.DataFrame(d2,columns=['年级','班级','姓名','详细信息','期末成绩'])
    
    result = pd.merge(df1, df2, how="outer")
    result['总成绩'] = result[['期中成绩', '期末成绩']].apply(lambda x: 
                                                   "及格" if x['期中成绩'] == x['期末成绩'] == "及格" else "不及格", axis=1)
    print(result)
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 5月20日
  • 已采纳回答 5月12日
  • 创建了问题 5月8日

悬赏问题

  • ¥20 西门子S7-Graph,S7-300,梯形图
  • ¥50 用易语言http 访问不了网页
  • ¥50 safari浏览器fetch提交数据后数据丢失问题
  • ¥15 matlab不知道怎么改,求解答!!
  • ¥15 永磁直线电机的电流环pi调不出来
  • ¥15 用stata实现聚类的代码
  • ¥15 请问paddlehub能支持移动端开发吗?在Android studio上该如何部署?
  • ¥20 docker里部署springboot项目,访问不到扬声器
  • ¥15 netty整合springboot之后自动重连失效
  • ¥15 悬赏!微信开发者工具报错,求帮改