ALGORITHM LOL 2022-09-01 17:41 采纳率: 91.3%
浏览 17
已结题

pandas处理有条件的合并

本人在使用pandas处理一些数据时不知如何操作:(数据量比较大)

我需要将两个dataframe进行处理,两个dataframe的title大部分都是相等的,对于两个df中相同的title,我需要提取出两个dataframe中my_score值较高的一个,最终两个dataframe经过处理后能生成一个心的df,这个df就是包含了初始的两个df中title相同且my_scrore分数较高的所有元素

(可能问题描述不是很清楚,可以与我交流)

以下为相关的内容:

df1:

img

df2

img

比如说df1的title为雁荡山的item,my_score为6706 > df2中的0,所以生成的df第一条为df1中的雁荡山条目,以此类推(df2中my_score并不都是0)

  • 写回答

2条回答 默认 最新

  • ALGORITHM LOL 2022-09-14 17:17
    关注

    之前这个问题放了一段时间,现在还是找到了一个比较笨拙的方法,

    ret_df_1 = pd.DataFrame(columns=['index','describe','like_num','title','transfer_num','url','my_score' ])
    count = 1
    for my_score in my_df_1['my_score']:
        other_score = other_df_1['my_score'][count]
        if my_score >= other_score:
            ret_df_1 = ret_df_1.append(pd.DataFrame(my_df_1.iloc[count, :]).T)
        else:
            ret_df_1 = ret_df_1.append(pd.DataFrame(other_df_1.iloc[count, :]).T)
        if count<19:
            count += 1
    ret_df_1
    
    

    img

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 9月22日
  • 已采纳回答 9月14日
  • 创建了问题 9月1日

悬赏问题

  • ¥30 这是哪个作者做的宝宝起名网站
  • ¥60 版本过低apk如何修改可以兼容新的安卓系统
  • ¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
  • ¥50 有数据,怎么建立模型求影响全要素生产率的因素
  • ¥50 有数据,怎么用matlab求全要素生产率
  • ¥15 TI的insta-spin例程
  • ¥15 完成下列问题完成下列问题
  • ¥15 C#算法问题, 不知道怎么处理这个数据的转换
  • ¥15 YoloV5 第三方库的版本对照问题
  • ¥15 请完成下列相关问题!