weixin_46344791 2020-06-21 11:24 采纳率: 83.3%
浏览 1110
已采纳

drop_duplicate函数多列使用详解

drop_duplicate(subset = 【'a','b'】)
这样表示就是代表如果a,b两列中某行的元素相同,才去重吗?

求这个函数使用的详解,搜了半天找不到很清晰的

  • 写回答

2条回答 默认 最新

  • 非昨 2020-06-21 14:38
    关注

    drop_duplicates参数就四个,subset,keep,inplace,ignore_index

    • subset:列的标签,或者传入一个标签列表,subset=['a','b']这种,只有指定列都重复的时候才会删除。
    • keep:选择需要保留的重复值,有三个选项, - first:保留第一次出现的行 - last:保留最后一次出现的行 - False:全删掉
      • inplace:传入布尔值,执行删除后,是否把结果赋值给原变量。比如df.drop_duplicates()之后,你可以选择将结果赋值给新的变量data=df.drop_duplicates(),也可以通过inplace参数,df.drop_duplicates(inplace=True),自动将结果赋值给df。
      • ignore_index:传入布尔值,默认是False,就是是否重置索引,从0开始往下排。
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

悬赏问题

  • ¥15 关于#matlab#的问题:期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707,使系统具有较小的超调量
  • ¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
  • ¥30 截图中的mathematics程序转换成matlab
  • ¥15 动力学代码报错,维度不匹配
  • ¥15 Power query添加列问题
  • ¥50 Kubernetes&Fission&Eleasticsearch
  • ¥15 報錯:Person is not mapped,如何解決?
  • ¥15 c++头文件不能识别CDialog
  • ¥15 Excel发现不可读取的内容
  • ¥15 关于#stm32#的问题:CANOpen的PDO同步传输问题