爬虫，爬取的网页源码为啥中间一部分缺失

最需要的那部分缺失了，因为页面是异步加载返回吗？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN技术专家团—麒麟奇 2021-03-02 07:55
关注
这部分html内容是用脚本运行时写入的，可以使用chrome开发者工具找到对应的脚本。

下图是在chrome开发者工具中断点的方法，添加断点后，刷新网页可以找到对应的脚本

1. 如果内容来自服务端其他的url，可从这个url获取内容

2. 如果内容在当前网页的脚本中，可以通过正则re分析获取内容

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python爬虫爬取网页为什么获得的不是正常网页数据 python 爬虫
2022-05-12 14:48

回答 2 已采纳这代码里面好多错误，你是怎么运行成功的？
python爬虫爬取网页代码遇到了一些问题 python 爬虫
2022-08-17 17:07

回答 3 已采纳因为元素里的你要的内容是通过 ajax 请求动态加载的，可以浏览器抓包去看下，你想要的这条数据到底是哪个请求返回的，找到真正的请求，然后模拟发送就行了
用爬虫爬取网页，表格第一行内容无法获得 python 爬虫
2021-12-14 09:11

回答 1 已采纳如果是想要获得标题，表头用的是th，不是td。和表格正文内容不是一样的。
Python爬虫详解（一看就懂）
2022-06-21 22:07

练习时长两年半的Programmer的博客比如我要获取豆瓣电影 Top250 榜单，如果不用爬虫，我们要先在浏览器上输入豆瓣电影的 URL ，客户端（浏览器）通过解析查到豆瓣电影网页的服务器的 IP 地址，然后与它建立连接，浏览器再创造一个 HTTP 请求发送给...
Python爬虫爬取不同网页的相似内容 python 爬虫
2022-03-11 17:52

回答 2 已采纳 re模块，正则表达式，split切分
python 爬虫，如何爬取相关数据 python 有问必答爬虫
2021-11-11 11:15

回答 1 已采纳先确定需要爬取的网站，然后分析网站的数据来源，是后端生成数据还是ajax生成数据，确定数据来源方式就根据HTTP请求编写代码，这个涉及一些请求参数的加密、转换等等处理，然后清洗数据和数据入库
Python爬虫 BeautifulSoup解析网页爬取内容为None python 有问必答
2021-08-31 14:07

回答 2 已采纳你抓的频率太快，IP被墙了
python爬取网页的内层页_python爬取网页下一页
2020-11-22 16:25

weixin_39520199的博客 Q4：Python爬取的网页代码会有缺失的现象吗？这个要看网页的数据是不是异步加载的，如果是异步加载的，就会有缺失现象，如果不是的话，就不会有缺失现象，下面我简单介绍一下非异步加载的数据和异步加载的数据这两种...
python爬虫爬取图片，图片打不开 python 爬虫
2022-10-18 21:52

回答 1 已采纳图片是从cdn上过来的，做了防盗链。在headers中添加Refer，指向该网站就行了。 import re import requests import os if not os.path.ex
Python爬虫只解析了一部分网页？ python 爬虫
2021-11-19 14:39

回答 1 已采纳第一个问题，你用html.xpath('//div[@class="co_content8"]/ul/table')找不到，是因为在table那一类，有很多分支标签，所以定位不到具体的元素。第二个问题
python爬虫爬取网页的时候get与post区别 python
2022-02-01 00:24

回答 1 已采纳 https://www.zhihu.com/tardis/sogou/art/439355463看链接，requests模块中get的参数可以放到url链接里，也可以封装到一个字典里requests.
【Python爬虫】从零开始写一个论文爬虫程序(串行爬取)
2020-12-12 20:50

圣☆哥的博客【Python爬虫】从零开始爬取Sci-Hub上的论文(串行爬取)项目简介步骤与实践STEP1 获取目标内容的列表STEP2 利用开发者工具进行网页调研 2020-12-06 阴是时候上手鸽了半个月的项目了。。。笔者为了偷懒，准备边做...
python爬虫翻页爬取的数据是第一页的重复数据 python 爬虫问答团队
2021-12-18 19:23

回答 1 已采纳爬下一页就好了
python爬虫爬网页部分内容空白，但源码可以看到，已解决
2020-02-22 16:07

一只快乐的饕餮的博客 python爬虫爬网页部分内容空白，但源码可以看到，已解决曾尝试各种方法，没有效果。使用的是函数requests.get()，已写header、cookie、User-Agent，也写了rsp.encoding = rsp.apparent_encoding。但是仍是爬取不了...
【爬虫】【python】爬取中华康网上清热药的信息
2022-02-11 18:57

天威难测的博客用BeautifulSoup库解析和提取数据解析特定标签的网页元素我最初喜欢用正则表达式来进行爬取，后来发现利用标签的形式解析源代码十分方便，也就是...# res是之前创建的需要解析的网页源码 # 并将解析器命名为soup t
没有解决我的问题, 去提问

悬赏问题

¥15 没有证书，nginx怎么反向代理到只能接受https的公网网站
¥50 成都蓉城足球俱乐部小程序抢票
¥15 yolov7训练自己的数据集
¥15 esp8266与51单片机连接问题(标签-单片机|关键词-串口)（相关搜索：51单片机|单片机|测试代码）
¥15 电力市场出清matlab yalmip kkt 双层优化问题
¥30 ros小车路径规划实现不了，如何解决？(操作系统-ubuntu)
¥20 matlab yalmip kkt 双层优化问题
¥15 如何在3D高斯飞溅的渲染的场景中获得一个可控的旋转物体
¥88 实在没有想法，需要个思路
¥15 MATLAB报错输入参数太多

爬虫，爬取的网页源码为啥中间一部分缺失

1条回答 默认 最新

悬赏问题

1条回答默认最新