Ki_Qi 2019-06-12 16:11 采纳率: 0%
浏览 952

请教,python+read_html爬取表格遇到问题?

各位大神好,目前是python小白,正自学爬数据,自己要爬取网站表格信息:
http://credit.customs.gov.cn/ccppwebserver/pages/ccpp/html/directory.html
图片说明

代码如下:
import pandas as pd
import csv

for i in range(1,158): # 爬取全部157页数据
url = 'http://credit.customs.gov.cn/ccppwebserver/pages/ccpp/html/directory.html'
tb = pd.read_html(url)[1]
tb.to_csv(r'1.csv', mode='a', encoding='utf_8_sig', header=1, index=0)
print('第'+str(i)+'页抓取完成')

但运行完只爬到了表头,请问各位大神哪里出错了?
  • 写回答

1条回答 默认 最新

  • MuNian123 2019-06-12 17:30
    关注

    图片说明
    是动态json数据 这是看到数据的方法 后面使用键值对获取你想要的就可以了

    评论

报告相同问题?

悬赏问题

  • ¥20 有关区间dp的问题求解
  • ¥15 多电路系统共用电源的串扰问题
  • ¥15 slam rangenet++配置
  • ¥15 有没有研究水声通信方面的帮我改俩matlab代码
  • ¥15 对于相关问题的求解与代码
  • ¥15 ubuntu子系统密码忘记
  • ¥15 信号傅里叶变换在matlab上遇到的小问题请求帮助
  • ¥15 保护模式-系统加载-段寄存器
  • ¥15 电脑桌面设定一个区域禁止鼠标操作
  • ¥15 求NPF226060磁芯的详细资料