PhaTracer 2018-05-15 02:42 采纳率: 22.2%
浏览 4161
已结题

python如何对dataframe中行去重?

RT,自己随便写了个,显示错误为
ValueError: Can only compare identically-labeled DataFrame objects

但总感觉思路都错了....请指教一下

import pandas as pd
from pandas import DataFrame
L=[]
file=open('F:\\FCD\\实验文本.txt')
a=file.readlines()
for line in a:
    L.append(line.split(','))
data=pd.DataFrame(L)

for i in range(len(data)):
    for u in range(len(data)):
        a=data[i:i+1]
        b=data[u:u+1]
        if u != i and a==b:
            data.drop(data.index[[i,i+1]],inplace=True)
  • 写回答

7条回答 默认 最新

  • zheshiweihe 2018-05-15 03:07
    关注

    import pandas as pd
    from pandas import DataFrame
    L=[]
    file=open('D:\FCD\1.txt')
    a=file.readlines()
    #print a
    for line in a:
    #print line
    #print line.strip('\n')
    L.append(line.strip('\n'))
    print L
    data=pd.DataFrame(L)
    print data
    print len(data)
    IsDuplicated = data.duplicated()

    print IsDuplicated

    print type(IsDuplicated)

    data = data.drop_duplicates()

    print data

    ##for i in range(len(data)):

    print "i:%d" % i

    for u in range(len(data)):

    print "u:%d" % u

    a=data[i:i+1]

    b=data[u:u+1]

    print "a:%s" % a

    print "b:%s" % b

    if u != i and a==b:

    data.drop(data.index[[i,i+1]],inplace=True)

    评论

报告相同问题?

悬赏问题

  • ¥15 stm32开发clion时遇到的编译问题
  • ¥15 如何用Labview在myRIO上做LCD显示?(语言-开发语言)
  • ¥15 Vue3地图和异步函数使用
  • ¥15 C++ yoloV5改写遇到的问题
  • ¥20 win11修改中文用户名路径
  • ¥15 win2012磁盘空间不足,c盘正常,d盘无法写入
  • ¥15 用土力学知识进行土坡稳定性分析与挡土墙设计
  • ¥70 PlayWright在Java上连接CDP关联本地Chrome启动失败,貌似是Windows端口转发问题
  • ¥15 帮我写一个c++工程
  • ¥30 Eclipse官网打不开,官网首页进不去,显示无法访问此页面,求解决方法