python爬虫爬到的网页内容不完全


import requests
from lxml import etree
from bs4 import BeautifulSoup
header = {
        'user-agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) '
                      'AppleWebKit/537.36 (KHTML, like Gecko) '
                      'Chrome/58.0.3029.110 Safari/537.36 SE 2.X MetaSr 1.0'
    }


resp=requests.get("http://ziziyy1.com/tv/",headers=header)
resp.encoding='utf-8'
print(resp.text)

resp.text与网页源代码不同

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
努力中的小白️ 2021-10-31 23:40
关注
beautifulsoup是爬静态网页的，应该是有些内容属于动态，可以尝试selenium

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python爬虫爬到的网页内容不完全 python 爬虫网络
2021-10-31 23:19

回答 1 已采纳 beautifulsoup是爬静态网页的，应该是有些内容属于动态，可以尝试selenium
python爬虫html获取不全 html python 爬虫
2022-06-24 19:43

回答 1 已采纳其实有的，但是这个网站应该是为了懒加载把url用base64密了一下，然后再动态加载，其实我下面发的这个就是url 是base64后的url 解码后就是https://s1.aigei.com/
Python爬虫requests反还内容与网页内容不相同 python 有问必答
2022-03-08 22:50

回答 2 已采纳 requests.get得到的是源代码，ajax动态加载或者js动态生成的html代码获取不到，需要直接请求接口获取数据或者从源代码中找到js数据源进行解析。截图中右边块的数据接口为下面这个，直接re
python爬虫爬网页部分内容空白，但源码可以看到，已解决
2020-12-22 19:08

奇怪的同一个网站同一个榜单，只是页数不同，前若干页能爬取，后若干页就爬取不了，一度怀疑是不允许爬。最后终于发现原因！因为Cookie找错了（kao！！！！！）注意要用这里的cookie！（下图是Chrome的开发者...
python爬虫网页标签个别无法读取 python 开发语言有问必答爬虫
2022-04-05 22:09

回答 3 已采纳因为个别标签字典中没有bond_nm和bond_nm_tip键 data2 = data_get['bond_nm'] data5 = data_get['bond_nm_tip']
python爬虫爬虫的网站源码不齐全怎么办 python
2019-04-26 16:05

回答 1 已采纳现在都是动态网页,你爬取到的只是一个基本框架而已。你可以用f12 然后检测一下http请求，基本上获取到的都是第一个请求。后面的数据都是通过js修改后的网页。交互式的。所以要想做复杂爬虫，
python爬虫爬到中间报错 python selenium 爬虫
2023-02-27 15:28

回答 3 已采纳 ..谢邀。页数有点多，就不跑完测了。报错是list index out of range,如果是在371页报的错，跟最后一页条数不够没啥关系。那首先317页和316页有啥区别？是317页就不够40条
python爬虫爬虫贴吧图片的实例
2023-01-25 20:48

python爬虫入门基础代码实例和1个简单的python爬虫爬虫贴吧图片的实例代码中给出了注释，并且可以直接运行 python爬虫主要操作步骤：获取网页html文本内容；分析html中图片的html标签特征，用正则解析出所有的...
python爬虫爬到331页无法继续 python
2023-03-13 12:46

回答 4 已采纳当前页提取列表数据超出索引，这也不是什么报错，当你列表里面没东西或者索引值超过了列表元素的时候就会出现这个问题，就是你爬到的这页，抓取的这个列表值，里面没东西或者东西太少。所以报错了。建议你换个网站爬
Python爬虫requests.get方法无法显示div中折叠内容 https python 有问必答爬虫
2021-11-27 19:16

回答 2 已采纳该页面数据是动态加载的，需要用此链接用post请求去获取https://www.xuetangx.com/api/v1/lms/get_product_list/?page=1
python爬虫数据显示问题 python 爬虫
2022-07-20 16:54

回答 3 已采纳首先，你这里写错了divs = query(".cm-content-box").items()
Python爬虫完整代码拿走不谢
2023-03-22 09:46

q56731523的博客对于新手做Python爬虫来说是有点难处的，前期练习的时候可以直接套用模板，这样省时省力还很方便。
Python爬虫系列（一）——手把手教你写Python爬虫
2021-10-23 15:47

纸照片的博客爬了不该爬的内容，比如大量个人信息，那可以快速实现“从入门到入狱”。 2. 了解网页网页一般由三部分组成，分别是 HTML（超文本标记语言）、CSS（层叠样式表）和 JS（活动脚本语言）。我们每次请求数据，服务器...
python爬虫课件+代码.zip
2021-07-25 12:18

跟着路飞学城樵夫老师一点点敲的，都能跑通，后面的爬取数据添加到excel和mysql数据库是看的另外老师的视频
Python爬虫：为什么你爬取不到网页数据
2022-08-09 19:01

坚持不懈的大白的博客 https://liuze.blog.csdn.net/article/details/105965562），但是当时小编也是胡乱编写的，其实里面有很多问题的，现在小编重新发布一篇关于爬虫爬取不到数据文章，希望各位读者更加了解爬虫。......
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 11月9日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 11月1日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月31日

悬赏问题

¥15 一个服务器已经有一个系统了如果用usb再装一个系统，原来的系统会被覆盖掉吗
¥15 使用esm_msa1_t12_100M_UR50S蛋白质语言模型进行零样本预测时，终端显示出了sequence handled的进度条，但是并不出结果就自动终止回到命令提示行了是怎么回事：
¥15 前置放大电路与功率放大电路相连放大倍数出现问题
¥30 关于<main>标签页面跳转的问题
¥80 部署运行web自动化项目
¥15 腾讯云如何建立同一个项目中物模型之间的联系
¥30 VMware 云桌面水印如何添加
¥15 用ns3仿真出5G核心网网元
¥15 matlab答疑关于海上风电的爬坡事件检测
¥88 python部署量化回测异常问题

python爬虫爬到的网页内容不完全

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新