穷遛客 2021-04-13 18:37 采纳率: 77.8%
浏览 39
已采纳

保留某一列中值相同(IDind值)的数据

目的:想将相邻年份数据,IDind相同的数据(意思是该个体两个年份都有,其他的先不要)保留,生成的数据只有两个年份 个体相同的平衡数据。

年份包括:

 

例如 保留1989年和1991年IDind为111101012的数据。

if df_2021['WAVE'] == 1989 | df_2021['WAVE'] == 1991:
    将筛选后df_2021保留成df_1991
elif df_2021['WAVE'] == 1991 | df_2021['WAVE'] == 1993:
    将筛选后df_2021保留成df_1993
elif df_2021['WAVE'] == 1993 | df_2021['WAVE'] == 1997:
    将筛选后df_2021保留成df_1997 以此类推
elif df_2021['WAVE'] == 1997 | df_2021['WAVE'] == 2000:  
elif df_2021['WAVE'] == 2000 | df_2021['WAVE'] == 2004:  
elif df_2021['WAVE'] == 2004 | df_2021['WAVE'] == 2006:  

  • 写回答

4条回答 默认 最新

  • CSDN专家-Yang 2021-04-13 19:33
    关注

    试下这段代码,可在此基础上完善,  思路:

    • 构造两个相邻年份的列表
    • 用for循环, 筛选数据后分组, 分组只取长度为2的数据(如果原数据有重复数据,可先去重)
    import pandas as pd
    import numpy as np
    
    lis1 = [1989,1991,1993,1997,2000,2004]
    lis2 = [1991,1993,1997,2000,2004,2006]
    
    lis3 = [[i,j] for i ,j in zip(lis1,lis2)]
    
    for i in lis3:
        datai = data[data['WAVE'].isin(i)].groupby('IDind').filter(lambda x:len(x)==2)
        datai.to_excel('df_'+ str(i[0]) +'.xlsx')
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(3条)

报告相同问题?

悬赏问题

  • ¥20 西门子S7-Graph,S7-300,梯形图
  • ¥50 用易语言http 访问不了网页
  • ¥50 safari浏览器fetch提交数据后数据丢失问题
  • ¥15 matlab不知道怎么改,求解答!!
  • ¥15 永磁直线电机的电流环pi调不出来
  • ¥15 用stata实现聚类的代码
  • ¥15 请问paddlehub能支持移动端开发吗?在Android studio上该如何部署?
  • ¥20 docker里部署springboot项目,访问不到扬声器
  • ¥15 netty整合springboot之后自动重连失效
  • ¥15 悬赏!微信开发者工具报错,求帮改