请教，python+read_html爬取表格遇到问题？

各位大神好，目前是python小白，正自学爬数据，自己要爬取网站表格信息：
http://credit.customs.gov.cn/ccppwebserver/pages/ccpp/html/directory.html
图片说明

代码如下：
import pandas as pd
import csv

for i in range(1,158): # 爬取全部157页数据
url = 'http://credit.customs.gov.cn/ccppwebserver/pages/ccpp/html/directory.html'
tb = pd.read_html(url)[1]
tb.to_csv(r'1.csv', mode='a', encoding='utf_8_sig', header=1, index=0)
print('第'+str(i)+'页抓取完成')

但运行完只爬到了表头，请问各位大神哪里出错了？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
MuNian123 2019-06-12 17:30
关注
是动态json数据这是看到数据的方法后面使用键值对获取你想要的就可以了

解决
无用 1
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python+selenium+xpath如何定位网页table表格中的数据 python selenium 有问必答爬虫
2022-02-25 12:44

回答 2 已采纳使用last()定位最后一个tr节点，再用索引获取。示例： from lxml import etree with open('a.html','r',encoding='utf-8') as f:
Python：如何爬取到该数据？ python
2020-09-07 10:20

回答 2 已采纳首先 f12 抓包，看看 ajax 的 json 请求的实际地址是什么，然后用 r = requests.get(request_url) obj = r.json() print(obj.学
python 爬取表格获取不到数据 python
2020-02-17 22:52

回答 4 已采纳爬取需要在请求头里面添加Host，要不然爬取不到任何信息，另外源码是不规则的html代码，所以需要指定html解析器 ``` # -*- coding：utf-8 -*- import os
python爬取2019国庆热门景点1——数据爬取与保存
2019-10-09 20:24

天天要向上的博客可是我试过df=df.append(place_list，ignore_index=True)之后，保存的文件是这样，第一页正常，之后的就有问题了，请教之后，想了很久，发现问题出在append了，因为每一页的数据保存之后都是一个表格，但是我现在...
python爬取数据遇到的一些问题 python
2021-11-24 07:07

回答 5 已采纳 import requests url = r'https://hugovk.github.io/top-pypi-packages/top-pypi-packages-30-days.min.js
Pandas借助Python爬虫爬取HTML网页表格保存到Excel文件的问题，解答。 python 有问必答
2021-09-20 23:00

回答 2 已采纳没有指定打开方式写为with open("./Gldjc_Pandas.txt","w+") as fin:即可有帮助望采纳~
如何使用python爬取canvas中的内容呢？ css javascript python
2022-04-29 10:30

回答 1 已采纳需要在浏览器上临时显示后端实时处理的图像，需要将图像数据转成json字符串传输给js绘图。后端python处理： import cv2 as cvfrom encodings import base
【爬虫实战】01利用python爬虫并进行数据分析（链家爬虫）
2019-06-27 20:05

wifi连不上的博客爬虫实战01——利用python爬虫并进行数据分析爬取链家二手房相关信息并进行数据分析 {https://sh.lianjia.com/ershoufang/pg} 一、爬虫部分背景需求来源于生活大数据时代来临，数据就是核心，数据就是...
python爬虫爬取网页代码遇到了一些问题 python 爬虫
2022-08-17 17:07

回答 3 已采纳因为元素里的你要的内容是通过 ajax 请求动态加载的，可以浏览器抓包去看下，你想要的这条数据到底是哪个请求返回的，找到真正的请求，然后模拟发送就行了
Python利用requests爬取网页遇到的payload问题 python 有问必答爬虫
2021-08-13 14:31

回答 5 已采纳网站多少
python爬虫如何垂直爬取网页内容？ python 开发语言爬虫
2021-11-29 19:12

回答 1 已采纳 img = requests.get(url=img_url) # img_url：图片的路径 with open('{}.jpg'.format(n), 'wb') as f: # n：文件名
自学python一个月赚取第一桶金，内心超级激动就忍不住想要分享
2021-01-12 22:53

两两️的博客大二学生一枚，了解到了python之后就开始了自学，通过csdn的学习，还有加入了python学习群向他们请教，学了一个月之后就尝试接单，赚取了第一桶金。在接单群接到了一份python期末设计。题目如下：综合使用课程所学...
scrapy框架+formdata+ajax爬取及翻页问题 python 数据挖掘测试用例
2020-03-25 14:18

回答 1 已采纳 def parse(self, response): result = eval(response.body.decode('utf-8')) 兄弟，你打印一下resu
老小白三个月Python的第一个爬虫
2018-12-18 16:14

HopKinsXX的博客中国人学习之后,他把遇到的难点总结经验教给你,那才是小白容易理解的等学会了看看前言技术再看外国的,基础一定要看国内的视频因为视频里讲的书里没有,视频里老师的大白话永远要比书里的术语容易理解 ...
用python处理文本数据（5）
2020-04-01 23:35

Tina姐的博客 utf-8 ''' python处理文本数据星座运势数据分析某个星座的综合运势，提取词频，制作词云图 ''' import pandas as pd data_path = '/Users/luo/workspace/pycharm/DataAnalysis/xingzuo.csv' data_df = pd.read_csv...
没有解决我的问题, 去提问

悬赏问题

¥20 有关区间dp的问题求解
¥15 多电路系统共用电源的串扰问题
¥15 slam rangenet++配置
¥15 有没有研究水声通信方面的帮我改俩matlab代码
¥15 对于相关问题的求解与代码
¥15 ubuntu子系统密码忘记
¥15 信号傅里叶变换在matlab上遇到的小问题请求帮助
¥15 保护模式-系统加载-段寄存器
¥15 电脑桌面设定一个区域禁止鼠标操作
¥15 求NPF226060磁芯的详细资料

请教，python+read_html爬取表格遇到问题？

1条回答 默认 最新

悬赏问题

1条回答默认最新