如何依据2018年ID数据及其对应目标变量对2019年的目标变量进行补充？

问题描述:2018年ID有3万多个,每个ID都有其对应的目标变量(以下简称V)数据;2019年ID有4万多个(与2018年的ID有相同,但不包含所有的2018年的ID),其中2019年的V部分数据缺失,缺失的部分需要根据2018年的V进行补充.

需要解决的问题:在2018年的ID中选出与2019年ID相同的ID,并依据选出的相同的ID对应的V数据填充至2019年的V数据中.

不知道如何解决,在线求教……

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

ENGineer_zlshuo 2022-02-13 23:14

关注

import pandas as pd

# 这是你的文件路径，默认你的文件为excel.xlsx
excel_file = 'D:/pythonProject/ID.xlsx'

# 读取文件数据为df结构（DataFrame结构），读取的sheet名字为“ID”, 先后按['2018年ID', '2019年ID']的顺序进行升序排序
df = pd.read_excel(excel_file, sheet_name = 'ID').sort_values(by = ['2018年ID', '2019年ID'], ascending=[True, True])

index = 0  # 开始检索2018年ID的位置为0（即2018年的第一个ID）
for row_c in range(0, df.shape[0]):  # 遍历2019年信息的每一行
    for row_a in range(index, df.shape[0]):   # 遍历2018年信息的每一行，如果同一列数据存在重复情况，此行改为for row_a in range(0, df.shape[0]):
        if df.iloc[row_c, 2] == df.iloc[row_a, 0]:  # 如果2019年ID等于2018年ID,按你的图片来，位置分别在第三列和第一列，对应索引2和0
            df.iloc[row_c, 3] = df.iloc[row_a, 1]  # 更改2019年变量,按你的图片来，位置分别在第四列和第二列，对应索引3和1
            index = row_a + 1 # 这样可以加快匹配速度，已经好了的就不匹配了,但是前提是你的同一列ID没有重复的数据

save_way = 'D:/pythonProject/result.xlsx'  # 结果文件的保存路径
df.to_excel(save_way, sheet_name = 'ID', index=False)  # 生成结果文件

编辑记录

报告相同问题？

关注问题

kettle中有源表和目标表，两个表的表输入的查询中的表名是一个变量，如何让源表中的数据更新到目标表中？
2018-11-13 12:48

回答 2 已采纳像Kattle这种用可视化的方式来进行配置以达到数据处理的目的，基本上是需要有明确的字段列表的，而你想要做的是一个相对通用的过程，现有的控件基本上是无法达到要求的你的第三种思路用java代码来
用mplus做潜变量链式中介之前需要将数据进行中心化或者标准化吗？ matlab python r语言
2023-02-04 23:02

回答 1 已采纳有用点击右侧采纳即可：在使用Mplus进行隐变量链式中介分析时，进行数据的中心化或标准化是有必要的。在处理数据的时候，建议将四个量表一起统一处理，以保证数据的一致性。未经处理的数据可能会影响模型的拟合
输入一组单字符变量名及其数值存入线性表数据结构
2022-06-16 11:33

回答 2 已采纳是要用C语言实现吗？需要定义一个结构体。在里面是需要存一个字符和一个数字吗？具体还需要进行什么运算~
Draft Fri Jan 04 11:37:47 CST 2019-数据集
2021-03-30 02:22

该数据集是“津南数字制造算法挑战赛”的初赛数据，发布于2018年12月27日，旨在考察参赛者在数据处理和算法应用上的能力。这个比赛可能涉及到各种机器学习和数据分析的技术，对于参赛者来说，理解和解析提供的数据是...
C# 使用变量来保存重要数据是否需要进行加密? c#
2021-08-24 09:30

回答 3 已采纳楼上说的对，题主这思路就不对，如果你使用数据的话，数据库可以帮你搞定密码储存问题。自己做的话常规思路都是只保存一个HASH值，不保存密码明文，用户输入密码后计算一下HASH，对比一下保存的，看是否一样
c#查询sql server数据库中的数据时，字段名能否使用变量？? c# sql visual studio
2021-02-09 23:11

回答 4 已采纳 private void insertfuzhu(string item,string tb) { database db = new database(); string
用R语言处理CLDS2016的stata数据时，问卷中的项目在数据中找不到对应的变量 r语言
2022-04-23 22:07

回答 1 已采纳好吧，就是没公开，需要特别申请
多目标跟踪MOT技术总结（持续更新）
2023-03-18 16:31

小叮当了个当的博客对目前主流的MOT算法做一个大概的技术总结~
SQL创建表，出现参数或变量：不能对数据类型bit指定列宽 sql 数据库
2022-04-23 22:39

回答 2 已采纳 bit表示一个二进制数字，只能为0或者1，所以不能定义长度，也不能放除0或1或null以外的值。你如果要用1和2，把类型改成int吧
QT中如何实现界面中的label实时显示变量数据？ c++ c语言开发语言
2019-11-12 20:29

回答 2 已采纳 https://blog.csdn.net/u013521296/article/details/98782097
ajax请求获得的数据如何传递给外部变量? ajax json
2017-09-11 03:42

回答 10 已采纳你ajax要用同步的就可以了如： $.ajax({ url: "some.php", async: false });
基于Python将单变量面板数据合成多变量面板数据
2021-10-30 21:09

andrewlr的博客对于有些问题时，我们需要对面板数据根据计量经济学的方法进行分析，比如面板门槛回归；但是面板门槛回归涉及的变量不只一个，正常情况下我们收集数据时，都是一个变量存在一个excel的sheet中，再将其合在一张表上面...
什么是目标变量(语言-c语言) c语言
2023-03-14 08:00

回答 3 已采纳目标变量就是指针指向的变量，比如 int a = 10; int * p = &a; a就是p指针的目标变量因为 t是二维数组，所以 t[1]是二维数组中，第1行的行指针，也就是第1行的首地址；而 *
数据分析真题日刷 | 小红书2019年校园招聘数据分析岗位在线笔试第二批
2019-07-05 20:39

圣洁不吃冰淇淋的博客小红书2019年校园招聘数据分析岗位在线笔试第二批（来源：牛客网）题型客观题：单选6道,不定项选择3道,填空3道；主观题：问答2道完成时间 120分钟牛客网评估难度系数 3颗星经过网易和京东的疯狂虐，终于做到...
目标检测综述（待补ing）
2023-12-06 18:03

怎么全是重名的博客目标检测作为计算机视觉中最基本、最具...本文从技术发展的角度回顾了几十篇关于目标检测的论文本文涵盖了许多主题，包括历史上的里程碑检测器，检测数据集，度量，检测系统的基本构建块，加速技术以及最新的检测方法。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 2月13日

悬赏问题

¥15 TeleScan不能修改bar
¥100 请问我基于逐飞库写的这个有关于mp u6050传感器的函数，为什么输出的值是固定的？
¥15 hadoop中启动hive报错如下怎么解决
¥15 如何优化QWebEngineView 加载url的速度
¥15 关于#hadoop#的问题，请各位专家解答！
¥15 如何批量抓取网站信息
¥15 Spring Boot离线人脸识别
¥15 使用Ant Design Pro vue的时候，使用环境变量的时候，构建报错是什么原因
¥15 NRF24L01能发送但是不能接收
¥15 想问一下这种情况怎么解决呢(关键词-file)

如何依据2018年ID数据及其对应目标变量对2019年的目标变量进行补充？

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新