python scrapy爬虫如果想要下一页但是没有href

scrapy 想实现爬取下一页的功能，但是”下一页“按钮并没有指向一个href。想请教如何实现爬取到下一页的功能
网址：https://chl.cn/?lishi

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

编程乐趣优质创作者: 后端开发技术领域 2022-12-14 05:41

关注

你要模拟参数，具体代码如下：

import http.client

conn = http.client.HTTPSConnection("chl.cn")
#page 5
#submit 下一页
payload = 'page=5&submit=%E4%B8%8B%E4%B8%80%E9%A1%B5&str='
headers = {
   'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/108.0.0.0 Safari/537.36',
   'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9',
   'Host': 'chl.cn',
   'Connection': 'keep-alive',
   'Content-Type': 'application/x-www-form-urlencoded'
}
conn.request("GET", "/?lishi", payload, headers)
res = conn.getresponse()
data = res.read()
print(data)
print(data.decode("utf-8"))

本回答被题主选为最佳回答 , 对您是否有帮助呢?

报告相同问题？

关注问题

【Python进阶】Python爬虫-Scrapy
2025-10-08 10:47

（时光煮雨）的博客本文介绍了Scrapy爬虫框架的基本使用，包括项目结构、简单爬虫编写和配置优化。主要内容包括：1）通过scrapy startproject创建项目结构；2）使用scrapy genspider生成爬虫模板；3）修改settings.py配置反爬措施...
Python进行网络爬虫（Scrapy框架的实践）
2024-08-27 04:01

盘古的弟弟的博客 Python是一个功能强大的编程语言，拥有许多用于网络爬虫的库和框架。其中，Scrapy是一个流行的开源网络爬虫框架，它提供了一套强大的工具和组件，使得开发和部署爬虫变得更加容易。本文将介绍如何使用Python和Scrapy...
开源 Python网络爬虫框架 Scrapy
2022-07-11 07:38

「已注销」的博客开源 Python 网络爬虫框架 Scrapy：http://blog.csdn.net/zbyufei/article/details/7554322 介绍所谓网络爬虫，就是一个在网上到处或定向抓取数据的程序，当然，这种说法不够专业，更专业的描述就是，抓取特定...
python scrapy框架爬虫_Python Scrapy爬虫框架学习
2020-11-21 03:28

weixin_39653320的博客 Scrapy 是用Python实现一个为爬取网站数据、提取结构性数据而编写的应用框架。一、Scrapy框架简介Scrapy是一个为了爬取网站数据，提取结构性数据而编写的应用框架。可以应用在包括数据挖掘，信息处理或存储历史数据...
从原理到实战，一份详实的 Scrapy 爬虫教程
2021-07-29 11:46

菜鸟学Python的博客之前分享了很多 requests 、selenium 的 Python 爬虫文章，本文将从原理到实战带领大家入门另一个强大的框架 Scrapy。如果对Scrapy感兴趣的话，不妨跟随本文动...
Python Scrapy：构建爬虫的性能调优工具
2025-04-28 17:28

AI Python 编程的博客我们将深入探讨如何通过各种手段提升Scrapy爬虫的性能，包括优化请求调度、处理数据存储等方面。本文将按照以下结构进行组织：首先介绍Scrapy的核心概念和联系，让读者对Scrapy有一个整体的认识；
使用Python进行网络爬虫Scrapy框架的实践
2024-05-09 00:11

一键难忘的博客这将在spiders目录下创建一个名为example.py的Python文件，其中包含了一个基本的爬虫示例。打开example.py文件，并编辑其中的start_urls和parse方法，以定义你要爬取的网站和如何解析网页的方式。# 在这里编写解析...
Python Scrapy爬虫面试题及参考答案
2025-03-01 00:19

大模型大数据攻城狮的博客定义一个Item类来存储提取的数据。在 Scrapy 中，自定义 Downloader Middleware 实现代理 IP 动态切换，可增强爬虫的稳定性和隐蔽性。以下是具体步骤。...在 Scrapy 项目中创建一个新的 Python 文件，例如。
Python Scrapy：打造个性化的网络爬虫
2025-04-27 13:43

AI Python 编程的博客 Python Scrapy是一个强大的开源网络爬虫框架，它提供了丰富的功能和灵活的配置选项，使得开发者可以轻松打造个性化的网络爬虫。本文的目的是深入介绍Scrapy框架，引导读者了解其核心概念、算法原理和实际应用，从而...
Python爬虫编程8——Scrapy框架
2022-03-11 13:27

彩色的泡沫的博客一.Scrapy介绍什么是Scrapy Scrapy是一个为了爬取网站数据，提取结构性数据二编写的应用框架，我们只需要实现少量的代码，就能快速的进行抓取，Scrapy使用了Twisted异步网络框架，可以极大的加速我们的下载速度。...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 12月14日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 12月14日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月14日

python scrapy爬虫如果想要下一页但是没有href

1条回答 默认 最新

问题事件

1条回答默认最新