爬取同站不同页面代码竟只返回相同结果

无论urls怎么变，传入到craw请求网页，总是获取到第一页的代码，甚至直接手写网址一样都是第一页的代码

import requests
from lxml import etree

urls =[
    f"https://www.cnblogs.com/#p{page}"
    for page in range(1,50+1)
]

headers = {
    "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.61 Safari/537.36",
    "referer": "https://www.cnblogs.com/"
}
def craw(u1):
    rep = requests.get(u1,headers=headers)
    return rep.text



# title ='//article[@class='post-item']//a/text()'
# href_u = '//article[@class='post-item']//a/@href'
def Processors(txt):
    x1 ="//article[@class='post-item']//a[@class='post-item-title']/text()"
    x2 = "//article[@class='post-item']//a/@href"
    html = etree.HTML(txt)

    title = html.xpath(x1)
    href_u = html.xpath(x2)
    print(txt)

# Processors(craw(urls[2]))         #爬取第3页，返回第一页代码
print(craw("https://www.cnblogs.com/#p3"))      #爬取第3页，返回第一页代码
print("------------------------------------------------------------------")
print(craw("https://www.cnblogs.com/#p5"))      #爬取第5页，返回第一页代码


# -------------
# 从craw函数请求url后的结果一直都第一页代码
# 反复验证了Processors函数没毛病。

我专门手写了2个不一样的url请求，在运行返回中同时寻找第一页中的标题，有返回2个，其他页的标题页均无发现

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
Vae 东 2022-01-13 09:43
关注
这个网站页面的翻页数据是通过接口的

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python 爬取的代码与网页上的代码不同 python 爬虫
2022-03-10 00:27

回答 1 已采纳这种结果用正则表达式提取就行，不能用xpath，另外如果结果数据类型为json的话可以把他转换成字典取值。python里面有json，jsonpath等模块就可以搞这种字符串的。有帮助的话采纳一下哦！
Python 爬虫爬取页面pagetext不完整是静态页面 python 有问必答爬虫
2021-10-21 15:16

回答 1 已采纳该页面信息通过用户选择选项，js动态渲染加载数据的，比如在选项框中输入name,在XHR中就可以看到name的动态加载链接，对其进行请求可获取相关信息的json数据信息。
为什么爬取的网站，页面代码少了好多，然后网站显示空白 python 有问必答爬虫
2022-02-19 20:26

回答 3 已采纳你是用requests爬取网页的吗你检查下这个网页中的内容是不是通过js代码读取外部json数据来动态更新的。requests只能获取网页的静态源代码，动态更新的内容取不到。对于动态更新的内容要用s
python2爬取百度贴吧指定关键字和图片代码实例
2020-09-18 20:05

本文旨在介绍使用Python 2.x版本编写的爬虫程序，通过具体代码实例，演示如何爬取百度贴吧中指定关键字的帖子及其中包含的图片资源。首先，我们需要注意的是，在使用网络爬虫时，必须遵守目标网站的“爬虫协议”...
python爬取相同div中的内容 python 有问必答
2022-10-19 21:14

回答 2 已采纳 from pyquery import PyQuery as pq import requests import csv url='https://item.kongfz.com/Cxiaosh
python爬虫爬取京东评论返回空白的求助贴 python
2021-02-17 18:23

回答 3 已采纳在header参数中添加referer默认值，应该是直接访问触发反爬了
python爬虫爬取网页代码遇到了一些问题 python 爬虫
2022-08-17 17:07

回答 3 已采纳因为元素里的你要的内容是通过 ajax 请求动态加载的，可以浏览器抓包去看下，你想要的这条数据到底是哪个请求返回的，找到真正的请求，然后模拟发送就行了
python爬取b站数据_python爬取B站up主数据（含代码）
2020-11-21 01:06

weixin_39637920的博客爬取网页，一般的做法是先直接向目标页面发起请求，然后返回，查看返回页面是否与目标页面相同，如果不同，则证明这个页面是动态加载页面，需要另寻它法。所以，我向B站发起了请求：...
Python 爬取数据这两行代码是什么意思呀 python 爬虫
2022-03-27 18:49

回答 2 已采纳就是取得data 前100 条i 是序号， _ 是内容把内容加字符串 ranking
Python selenium的爬虫无法完整爬取整个页面的内容 python selenium 爬虫
2021-10-24 09:44

回答 1 已采纳爬取内容不完整，应该是文档的更多内容，要往下滑动页面才会出现这个不太清楚，应该不是什么反爬，就是类似于中途给你弹出个广告，要具体分析怎么弄VIP内容肯定是需要你的账号是VIP才能看得到的，与selen
Python 如何爬取相同url下，多个页面的链接内容 python
2015-09-28 02:31

回答 3 已采纳多个页面的链接内容？是地址相同？还是一个页面里面包含多个url,你可以先解析相应的url，然后在通过遍历的方式进行爬取。
Python-数据爬取（爬虫）
2024-07-12 17:01

.房东的猫的博客定义：深度优先搜索是一种遍历或搜索树或图的算法，从起始节点开始，一直沿着一个分支走到底，再回溯到上一个节点继续搜索下一个分支，...在大规模数据爬取时，选择合适的存储方式取决于数据的规模、结构和访问需求。
python爬取的内容想添加到代码里面 python
2022-01-07 14:44

回答 6 已采纳 Python有两个相关的东西，一个叫eval，一个叫exec。它们可以实现执行字符串中的代码（不同的是eval不支持复杂代码）。不够是吧？对不起，我们还有一个叫runfile的东西。Debugger
基于python selenium实现B站直播弹幕和礼物信息爬虫源码+项目操作说明.zip
2023-10-12 11:01

基于python selenium实现B站直播弹幕和礼物信息爬虫源码+项目操作说明.zip 实现原理： 1.核心：数据去重直播间网页页面可容纳的弹幕和礼物数据是有限的，且这些数据不断地在更新增加，超过一定量后，将会发生滚动...
用python爬取网页数据代码_python实现web页面数据抓取代码
2020-11-22 16:44

weixin_39925031的博客 python实现web页面数据抓取代码web数据抓取是一个经常在python的讨论中出现的主题。有很多方法可以用来进行web数据抓取，然而其中好像并没有一个最好的办法。有一些如scrapy这样十分成熟的框架，更多的则是像...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月13日

悬赏问题

¥15 有人会用py或者r画这种图吗
¥15 MOD04_3K图像预处理
¥15 [VASP]关于超胞大小和k 点网格的收敛性测试
¥15 pip下载paddle2onnx离谱错误
¥60 db2move nlzxams import 导出db2备份数据报错
¥15 关于#python#的问题：全文总结功能咨询
¥15 俄罗斯方块中无法同时消除多个满行
¥15 c#转安卓 java html
¥15 使用gojs3.0，如何在nodeDataArray设置好text的位置，再go.TextBlock alignment中进行相应的改变
¥15 psfusion图像融合指标很低

爬取同站不同页面代码竟只返回相同结果

无论urls怎么变，传入到craw请求网页，总是获取到第一页的代码，甚至直接手写网址一样都是第一页的代码

我专门手写了2个不一样的url请求，在运行返回中同时寻找第一页中的标题，有返回2个，其他页的标题页均无发现

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新