PhaTracer 2018-05-15 02:42 采纳率: 22.2%
浏览 4161
已结题

python如何对dataframe中行去重?

RT,自己随便写了个,显示错误为
ValueError: Can only compare identically-labeled DataFrame objects

但总感觉思路都错了....请指教一下

import pandas as pd
from pandas import DataFrame
L=[]
file=open('F:\\FCD\\实验文本.txt')
a=file.readlines()
for line in a:
    L.append(line.split(','))
data=pd.DataFrame(L)

for i in range(len(data)):
    for u in range(len(data)):
        a=data[i:i+1]
        b=data[u:u+1]
        if u != i and a==b:
            data.drop(data.index[[i,i+1]],inplace=True)
  • 写回答

7条回答

  • zheshiweihe 2018-05-15 03:07
    关注

    import pandas as pd
    from pandas import DataFrame
    L=[]
    file=open('D:\FCD\1.txt')
    a=file.readlines()
    #print a
    for line in a:
    #print line
    #print line.strip('\n')
    L.append(line.strip('\n'))
    print L
    data=pd.DataFrame(L)
    print data
    print len(data)
    IsDuplicated = data.duplicated()

    print IsDuplicated

    print type(IsDuplicated)

    data = data.drop_duplicates()

    print data

    ##for i in range(len(data)):

    print "i:%d" % i

    for u in range(len(data)):

    print "u:%d" % u

    a=data[i:i+1]

    b=data[u:u+1]

    print "a:%s" % a

    print "b:%s" % b

    if u != i and a==b:

    data.drop(data.index[[i,i+1]],inplace=True)

    评论

报告相同问题?

悬赏问题

  • ¥15 安装svn网络有问题怎么办
  • ¥15 Python爬取指定微博话题下的内容,保存为txt
  • ¥15 vue2登录调用后端接口如何实现
  • ¥65 永磁型步进电机PID算法
  • ¥15 sqlite 附加(attach database)加密数据库时,返回26是什么原因呢?
  • ¥88 找成都本地经验丰富懂小程序开发的技术大咖
  • ¥15 如何处理复杂数据表格的除法运算
  • ¥15 如何用stc8h1k08的片子做485数据透传的功能?(关键词-串口)
  • ¥15 有兄弟姐妹会用word插图功能制作类似citespace的图片吗?
  • ¥15 latex怎么处理论文引理引用参考文献