Ki_Qi 2019-06-12 16:11 采纳率: 0%
浏览 952

请教,python+read_html爬取表格遇到问题?

各位大神好,目前是python小白,正自学爬数据,自己要爬取网站表格信息:
http://credit.customs.gov.cn/ccppwebserver/pages/ccpp/html/directory.html
图片说明

代码如下:
import pandas as pd
import csv

for i in range(1,158): # 爬取全部157页数据
url = 'http://credit.customs.gov.cn/ccppwebserver/pages/ccpp/html/directory.html'
tb = pd.read_html(url)[1]
tb.to_csv(r'1.csv', mode='a', encoding='utf_8_sig', header=1, index=0)
print('第'+str(i)+'页抓取完成')

但运行完只爬到了表头,请问各位大神哪里出错了?
  • 写回答

1条回答 默认 最新

  • MuNian123 2019-06-12 17:30
    关注

    图片说明
    是动态json数据 这是看到数据的方法 后面使用键值对获取你想要的就可以了

    评论

报告相同问题?

悬赏问题

  • ¥15 微信小程序协议怎么写
  • ¥15 c语言怎么用printf(“\b \b”)与getch()实现黑框里写入与删除?
  • ¥20 怎么用dlib库的算法识别小麦病虫害
  • ¥15 华为ensp模拟器中S5700交换机在配置过程中老是反复重启
  • ¥15 java写代码遇到问题,求帮助
  • ¥15 uniapp uview http 如何实现统一的请求异常信息提示?
  • ¥15 有了解d3和topogram.js库的吗?有偿请教
  • ¥100 任意维数的K均值聚类
  • ¥15 stamps做sbas-insar,时序沉降图怎么画
  • ¥15 买了个传感器,根据商家发的代码和步骤使用但是代码报错了不会改,有没有人可以看看