shine944
2021-03-27 18:25
采纳率: 100%
浏览 272

pandas实现按条件连接两个dataframe,具体条件见内容

excel1:

excel2:

输出新的dataframe(excel3):

具体连接:按照A值将exce1和excel2两表连接成一个新表excel3, 连接条件为excel1表中“告警开始时间”与excel2表中“停电时间”最接近的值对应的行相连接,放在excel1生成新表excel3,是否可用apply和merge函数实现,具体代码求助

  • 点赞
  • 写回答
  • 关注问题
  • 收藏
  • 邀请回答

3条回答 默认 最新

  • 已采纳

    试下这样看是否可以:

    1 先用A字段将两个表合并

    2 然后计算 告警开始时间和停电时间的时间差 

    3 时间差字段根据你的条件筛选(可根据是否必须停电时间在告警开始时间后面进行筛选 , 如果不考虑的话, 只看时间差的绝对值即可)

    4 最后先排序分组后, 筛选第1条记录

    import pandas as pd
    import numpy as np
    
    data1 = pd.read_excel('c:/users/yyz/desktop/123.xlsx',sheet_name='Sheet1')
    data2 = pd.read_excel('c:/users/yyz/desktop/123.xlsx',sheet_name='Sheet2')
    
    data3 = pd.merge(data1,data2,on='A',how='left')
    data3['时间差'] = abs(data3['告警开始时间']-data3['停电时间'])
    
    result1 = data3.sort_values(by='时间差').groupby(['告警开始时间','A']).first()
    
    result2 = result1.drop('时间差',axis=1)
    点赞 1 打赏 评论
  • shine944 2021-03-27 19:19

    点赞 1 打赏 评论
  • 有问必答小助手 2021-03-29 10:48

    您好,我是问答小助手,你的问题已经有小伙伴为您解答了问题,您看下是否解决了您的问题,可以追评进行沟通哦~

    如果有您比较满意的答案 / 帮您提供解决思路的答案,可以点击【采纳】按钮,给回答的小伙伴一些鼓励哦~~

    ps:问答VIP仅需29元,即可享受5次/月 有问必答服务,了解详情>>> https://vip.csdn.net/askvip?utm_source=1146287632

    点赞 打赏 评论

相关推荐 更多相似问题