YiOne_fatandstrong 2017-11-06 12:49 采纳率: 100%
浏览 1607
已采纳

Python2.7:数据清洗的list index out of range问题

from csv import reader

data_rdr = reader(open('mn.csv','rb'))
header_rdr = reader(open('mn_headers.csv','rb'))

data_rows = [d for d in data_rdr]
header_rows = [h for h in header_rdr]

bad_rows = []

for h in header_rows:
    if h[0] not in data_rows[0]:
        bad_rows.append(h)

for h in bad_rows:
    header_rows.remove(h)

print len(header_rows)

 Traceback (most recent call last):
  File "/home/sewell-hoo/datafiles/test_listindex.py", line 12, in <module>
    if h[0] not in data_rows[0]:
IndexError: list index out of range

正在读《python数据处理》一书,这是第7章第2小节的内容:
处理2个CSV文件,却一直提示List index out of range,实在是想不到哪里错了。
请忽略图中配图的文件'mn_header_update.csv',两者是一个文件

图片说明

  • 写回答

5条回答

  • crazyskady 2017-11-07 04:28
    关注

    目测你的header_rows中有[]这样的空数据,你试着打印下:
    for h in header_rows:
    if h == []:
    print 'h is []'

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(4条)

报告相同问题?

悬赏问题

  • ¥15 求差集那个函数有问题,有无佬可以解决
  • ¥15 【提问】基于Invest的水源涵养
  • ¥20 微信网友居然可以通过vx号找到我绑的手机号
  • ¥15 寻一个支付宝扫码远程授权登录的软件助手app
  • ¥15 解riccati方程组
  • ¥15 display:none;样式在嵌套结构中的已设置了display样式的元素上不起作用?
  • ¥15 使用rabbitMQ 消息队列作为url源进行多线程爬取时,总有几个url没有处理的问题。
  • ¥15 Ubuntu在安装序列比对软件STAR时出现报错如何解决
  • ¥50 树莓派安卓APK系统签名
  • ¥65 汇编语言除法溢出问题