pyspider无法爬取下一页js中的内容

使用pyspidert爬取股票中的内容，在点击下一页后url链接并不改变，只改变了js渲染中的内容，所以无法使用网上的教程。
在使用pyspider内嵌JavaScript时，也只能爬取第一页，无法爬取之后的内容。

def index_page(self, response):
        for each in response.doc('#main-table > tbody > tr > td.listview-col-Code > a').items():
            self.crawl(each.attr.href, callback=self.list_page)
        #翻页
        self.crawl(response.url, callback=self.index_page, fetch_type='js',js_script='''function() {setTimeout("$('.next').click()", 5000);}''')

第一次爬取后，20支股票和自己页面链接
图片说明

第二次爬取本链接，希望得到第二页内容
图片说明

结果还是第一页，
图片说明

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
devmiao 2019-03-26 23:36
关注
https://www.jianshu.com/p/8d955deac99b

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

pyspider支持用代理爬取https链接吗？ html5 unix 正则表达式
2021-02-26 11:08

回答 1 已采纳可以设置validate_cert=false，这样可以不验证证书 self.crawl('http://www.example.org/', validate_cert=False)
pyspider配置问题，无法运行，如何解决？(语言-python) python 有问必答
2022-04-08 15:19

回答 2 已采纳由于pyspider长期没有维护，许多模块导入方法已经改变，可尝试使用基于原库修改的新版本：https://pypi.org/project/pyspider3/
python 爬虫 pyspider遇到的问题 python 爬虫
2017-12-08 09:03

回答 6 已采纳另外才注意到你现在的这个程序写的有问题的你在response里面写的请求? 应该是在请求的时候就将参数发过去的程序有问题啊 for循环要写在前面的on start 函数里面
[Python3网络爬虫开发实战] pyspider 的基本使用
2019-12-07 17:57

xuange01的博客我们要爬取的目标是去哪儿网的旅游攻略，链接为 http://travel.qunar.com/travelbook/list.htm，我们要将所有攻略的作者、标题、出发日期、人均费用、攻略正文等保存下来，存储到 MongoDB 中。准备工作请确保...
Mac os big sur运行pyspider的时候报错 python 有问必答爬虫
2021-10-31 03:14

回答 2 已采纳你好，我是有问必答小助手，非常抱歉，本次您提出的有问必答问题，技术专家团超时未为您做出解答本次提问扣除的有问必答次数，将会以问答VIP体验卡（1次有问必答机会、商城购买实体图书享受95折优惠）的形式为
pyspider all运行正常，为啥还是打不开pyspider的ui界面 python 有问必答
2021-09-19 11:07

回答 1 已采纳在地址栏输入，不是百度。
Python pyspider all运行出错 python 有问必答
2021-11-08 11:10

回答 2 已采纳可能是python版本的问题，可以试试低版本这问题在github有提及： PicklingError when input pyspider · Issue #950 ·
Python 爬虫框架 - PySpider
2022-07-11 07:38

「已注销」的博客 Python爬虫进阶四之PySpider的用法：http://cuiqingcai.com/2652.html 网络爬虫剖析，以Pyspider为例：http://python.jobbole.com/81109 Python爬虫利器六之PyQuery的用法：...爬虫框架pyspider个...
VSCODE新建终端，为什么会直接运行source /home/luyx/bin/activate？ vscode
2023-01-25 11:09

回答 2 已采纳我直接把source /home/luyx/bin/activate中的activate文件给删了，就不会每次打开终端就会自动进入这个环境了
请问，pip的安装时的报错 python
2019-09-30 22:45

回答 1 已采纳你先安装下setuptools https://blog.csdn.net/qq_38880380/article/details/79734158
14、pyspider框架
2021-02-27 12:31

T o r的博客一、pyspider框架介绍 1.简介 pyspider 是个强大的由python实现的爬虫系统。纯python的强大的webui，支持脚本编辑，任务监控，项目管理和结果查看数据后台支持，MySQL，MongoDB,Reids,SQLite,Elasticsearch,...
爬虫Scrapy框架初体验
2021-03-18 17:18

梁同学Coding的博客 yield scrapy.Request(next_page, callback=self.parse) #①：我们继续爬取的链接（next_page），这里是下一页链接，当然也可以是内容页。 #②：我们要把链接提交给哪一个函数爬取，这里是parse函数，也就是本...
python爬虫框架-PySpider
2017-03-24 14:52

weixin_34241036的博客 From:http://cuiqingcai.com/2652.html From:... PySpider PySpider github地址 PySpider 官方文档 PySpider 中文文档 PySpider是binux做的一个爬虫架构的开源化实现。主要的功能...
Python网络爬虫使用教程
2023-06-13 16:50

TTTALK的博客 python爬虫资源抓取--urllib/requests/requests-html、正则表达式、数据解析-Beautiful Soup/lxml/selectolax、自动化爬虫--selenium、爬虫框架--Scrapy/pyspider、模拟登录与验证码识别、autoscraper
《Python网络爬虫实战》读书笔记2
2020-04-27 14:43

每天看一遍，防止恋爱&&堕落的博客文章目录更强大的爬虫网站反爬虫多进程编程与异步爬虫抓取用...下载网页中的小说和购物评论爬取小说网的内容下载京东购物评论爬虫实践：保存感兴趣的图片爬虫实践：网上影评分析爬虫实践：使用PySpider爬虫框架参...
《python3 网络爬虫开发实践》笔记
2021-02-21 15:31

流左沙的博客由于书中内容繁多，所以我记的笔记都是理论部分较多，代码编写以及工具的使用涉及不多，感兴趣可以查阅下该书。本文大纲如下(预计读完需要 15 分钟)： 1、基本的环境和工具 1.1、请求库，发送网络请求 1.2、...
爬虫教程（ 2 ） --- scrapy 教程、实战
2020-09-01 00:46

擒贼先擒王的博客 Scrapy 是一个为了爬取网站数据，提取结构性数据而编写的应用框架。其最初是为了页面抓取 (更确切来说, 网络抓取 )所设计的，也可以应用在获取 API 所返回的数据 (例如 Amazon Associates Web Services ) 或者通用...
Node及后端
2017-12-27 14:09

weixin_34245749的博客找回 Node.js 里面那些遗失的 ES6 特性 | Taobao FED | 淘宝前端团队由于 Babel，WebPack， React 技术的流行，小明同学已经开始在前端代码里面用上了 ECMAScript 2015 （以下称 ES6 ）的众多特性。import, ...
python 爬虫之路教程
2017-05-04 12:02

Android系统攻城狮的博客网络爬虫是搜索引擎系统中十分重要的组成部分它负责从互联网中搜集网页采集信息这些网页信息用于建立索引从而为搜索引擎提供支持它决定着整个引擎系统的内容是否丰富信息是否即时因此其性能的优劣直接影响着搜索...
好东西积累起来
2018-03-22 21:17

guimaster的博客关于代理IP app爬取其他工具 ip代理池：https://github.com/Python3WebSpider/ProxyPool Charles 从入门到精通 - 唐巧的技术博客：https://juejin.im/entry/56488b7660b20fc9b9c2f0be Fiddler抓包简易教程： ...
没有解决我的问题, 去提问

悬赏问题

¥15 k8s部署jupyterlab，jupyterlab保存不了文件
¥15 ubuntu虚拟机打包apk错误
¥199 rust编程架构设计的方案有偿
¥15 回答4f系统的像差计算
¥15 java如何提取出pdf里的文字？
¥100 求三轴之间相互配合画圆以及直线的算法
¥100 c语言，请帮蒟蒻写一个题的范例作参考
¥15 名为“Product”的列已属于此 DataTable
¥15 安卓adb backup备份应用数据失败
¥15 eclipse运行项目时遇到的问题

pyspider无法爬取下一页js中的内容

1条回答 默认 最新

悬赏问题

1条回答默认最新