weixin_46344791
weixin_46344791
采纳率84.6%
2020-07-03 12:34

python drop_duplicate去除重复行

10
已采纳

问题是这个函数会把某列符合条件的这一行都给删掉了,我只删去这一列的重复值,但是保留其他列的重复值。
就是本来是很多个一样的数对应很多数,我想变成一对多。

图片说明
这个意思。我的数据有四列,对其中一列进行这样的操作

  • 点赞
  • 写回答
  • 关注问题
  • 收藏
  • 复制链接分享
  • 邀请回答

3条回答

  • qqzhuimengren PythonJavaC++go 9月前

    那你啥意思?某列出现重复值,把它挖空吗?
    dataFrame是个矩阵形式,该函数是用来根据某一个列或多个列来去除重复的。
    你的需求不是很明白,但应该需要其它方法,而不是纠结该函数

    点赞 评论 复制链接分享
  • tcy23456 tcy23456 9月前

    你的意思我大概明白,解决办法
    方法1:如何你必须要用python,那你应将execl数据以标准的形式
    方法2:
    你直接在python中调用execl处理模块进行处理,你必须熟悉excel VBA相关函数(脚本语言,通过宏执行)
    方法3:
    你直接应用excel VBA函数(脚本语言,通过宏执行)处理数据

    如果数据量较小用VBA还可用,如数据量大如10000行,VBA效率比较低

    你的这个问题牵扯到数据预处理,说白点就是处理excel数据,要想灵活处理,必须熟练VBA,学习周期还是漫长的,对于会python的,花费这么大代价无多大意义。
    之前我用excel VBA处理期货数据,效率低,有时要几分钟,当然是1-10万行数据,最后用mysql+python处理

    不知你的具体细节,自己看吧

    另外上面老兄回答的比较好

    点赞 评论 复制链接分享
  • qq_39412061 吃鸡王者 9月前

    你的这个需求适合使用datafram的groupby('E')方法,
    drop_duplicate方法实现不来你想要的结果

    点赞 评论 复制链接分享