五秒速的刀 2021-03-28 17:14 采纳率: 100%
浏览 87
已采纳

python中用pandas处理数据

 

对于这种csv文件,用pandas怎么可以将红圈部分的数据补全,每个学生都考了四门,怎样可以进行数据补全,整个csv文件也没有空值。

求大佬支援

 

  • 写回答

3条回答 默认 最新

  • 关注

    试下这种方式:

    先构造一个姓名和科目的二维表, 然后merge. 可以对缺失值进行填充

    import pandas as pd
    import numpy as np
    
    data = pd.read_excel('c:/users/yyz/desktop/123.xlsx')
    
    lis1 = data['科目'].unique().tolist()
    lis2 = data['姓名'].unique().tolist()
    
    data2 = pd.DataFrame([[i,j] for i in lis2 for j in lis1],columns=['姓名','科目'])
    
    result = pd.merge(data,data2,on=['姓名','科目'],how='outer').sort_values(by=['姓名','科目']).reset_index(drop=True)
    print(result)
               科目          姓名    成绩
    0   algorithm  zhaoyuchen  21.0
    1    computer  zhaoyuchen  22.0
    2     english  zhaoyuchen  20.0
    3        math  zhaoyuchen   NaN
    4   algorithm      zhouqi  19.0
    5    computer      zhouqi   NaN
    6     english      zhouqi  18.0
    7        math      zhouqi   NaN
    8   algorithm     zhoutao  15.0
    9    computer     zhoutao  17.0
    10    english     zhoutao  14.0
    11       math     zhoutao  16.0
    12  algorithm         zss  11.0
    13   computer         zss  13.0
    14    english         zss  10.0
    15       math         zss  12.0
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

悬赏问题

  • ¥15 用windows做服务的同志有吗
  • ¥60 求一个简单的网页(标签-安全|关键词-上传)
  • ¥35 lstm时间序列共享单车预测,loss值优化,参数优化算法
  • ¥15 Python中的request,如何使用ssr节点,通过代理requests网页。本人在泰国,需要用大陆ip才能玩网页游戏,合法合规。
  • ¥100 为什么这个恒流源电路不能恒流?
  • ¥15 有偿求跨组件数据流路径图
  • ¥15 写一个方法checkPerson,入参实体类Person,出参布尔值
  • ¥15 我想咨询一下路面纹理三维点云数据处理的一些问题,上传的坐标文件里是怎么对无序点进行编号的,以及xy坐标在处理的时候是进行整体模型分片处理的吗
  • ¥15 一直显示正在等待HID—ISP
  • ¥15 Python turtle 画图