没有进行筛选，scrapy-Request callback不调用，跪求大神指点！！！

Spider的代码是这样的：

    def parse(self, response):
        url_list = response.xpath('//a/@href').extract()[0]
        for single_url in url_list:
                    url = 'https:' + single_url.xpath('./@href').extract()[0]
            name = single_url.xpath('./text()').extract()[0]
            yield scrapy.Request(url=url, callback=self.parse_get, meta={'url':url, 'name':name})

    def parse_get(self, response):
            print(1)
                item = MySpiderItem()
                item['name'] = response.mate['name']
                item['url'] = response.mate['url']
                yield item

middlewares的代码是这样的：

    def process_request(self, request, spider):
        self.driver = webdriver.Chrome()
        self.driver.get(request.url)
        if 'anime' in request.meta:
            element = WebDriverWait(self.driver, 10).until(EC.presence_of_element_located((By.ID, 'header')))
        else:
            element = WebDriverWait(self.driver, 10).until(EC.presence_of_element_located((By.ID, 'header')))
        html = self.driver.page_source
        self.driver.quit()

        return scrapy.http.HtmlResponse(url=request.url, body=html, request=request, encoding='utf-8')

我是用Chrome来运行的，Request里面的url是一个一个地打开了，但是一直没有调用parse_get。一直都没有加allowed_domains，也尝试过在Request中加dont_filter=True，但是网站能打开，证明应该不是网站被过滤了的问题。实在是没有想法了，求大神指导！！！！

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2022-09-09 17:34
关注
不知道你这个问题是否已经解决, 如果还没有解决的话:
这篇文章：爬虫中scrapy.Request的更多参数也许有你想要的答案，你可以看看

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 以帮助更多的人 ^-^
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python3 scrapy Request 请求时怎么保持headers 的参数首字母不大写 python 数据挖掘
2019-05-15 16:44

回答 1 已采纳在spider文件中spider类的上面写下不希望首字母大写的header ``` from twisted.web.http_headers import Headers as TwistedH
为什么我不能调用csrapy.Requeat()属性！求助大神 python
2020-03-31 22:19

回答 1 已采纳 Requeat? 应该是request吧
scrapy中start_requests指定回调函数为何没有调用 python 有问必答爬虫
2022-01-20 23:02

回答 2 已采纳改成这样试试 yield scrapy.Request(url=login_url, headers=header, body=json.dumps(param), method='
scrapy-redis + Bloom Filter分布式爬取tencent社招信息
2019-06-11 13:18

weixin_30765577的博客 scrapy-redis + Bloom Filter分布式爬取tencent社招信息什么是scrapy-redis 什么是 Bloom Filter 为什么需要使用scrapy-redis + Bloom Filter 目标任务安装爬虫创建爬虫编写items.py 编写spiders/...
跪求，scrapy中为什么def parse(self, response)无响应，求大神 python
2021-01-30 21:50

回答 5 已采纳把跟scrapy一起的库删除重新下载就好了
爬虫scrapy框架爬不出来，但是request可以出来 http python 爬虫
2022-05-06 00:26

回答 2 已采纳你应该继承 scrapy.SpiderCrawlSpider 不要自定义 parse 函数。
【scrapy爬虫问题】scrapy.xpath解析返回的结果有问题，求解答！！！ python
2020-07-13 19:48

回答 1 已采纳先打印response看看和你在网页上看到的一样吗？？
python scrapy框架df_Python项目--Scrapy框架(一)
2020-11-21 03:28

weixin_39555179的博客环境win8, python3.7, pycharm正文1.Scrapy框架的安装在cmd命令行窗口执行:pip install Scrapy即可完成Scrapy框架的安装2. 创建Scrapy项目在cmd命令行窗口下切换到想要的目录下, 我这里是C:\Users\Administrator\...
为啥Scrapy能成功运行但json文件是空的，求大神解答 python 有问必答
2021-05-19 19:48

回答 4 已采纳原因可能是这个网址的网页跳转，无法获取到数据，尝试更改网址，重写xpath或css。
scrapy-redis到底需要怎样部署啊？分别应该安装什么软件？ python redis
2019-06-14 18:44

回答 3 已采纳直接源码安装redis就可以了, 其他的都不用安装的呀
scrapy-爬取京东笔记本电脑信息问题 chrome python selenium 开发语言
2020-09-01 19:12

回答 2 已采纳 ``` browser.quit() return HtmlResponse(url=request.url, body=browser.page_source, re
两周从爬虫小白变大神，看完你就知道我不是标题党了【五万字教程，建议收藏】
2021-09-28 09:39

五包辣条！的博客 Python爬虫第一天什么是爬虫爬虫与Web后端服务之间的关系 Python爬虫技术的相关库常见反爬虫的策略爬虫库urllib【重要】作业爬虫第二天回顾知识点 requests库【重点】数据解析方式之xpath 绝对...
python scrapy爬虫如果想要下一页但是没有href python 爬虫
2022-12-14 00:18

回答 1 已采纳你要模拟参数，具体代码如下： import http.client conn = http.client.HTTPSConnection("chl.cn") #page 5 #submit 下一页
还用什么scrapy！用这个框架快速轻量，原来爬虫这么简单
2021-03-27 14:34

pyjishu的博客之前，我们写爬虫，用得最多的框架莫过于scrapy啦，今天我们用最近新出的爬虫框架feapder来开发爬虫，看下是怎样的体验。目标网站：aHR0cHM6Ly93d3cubGFnb3UuY29tLw== 需求：采集职位列表与职位详情，详情需每7天...
python爬虫scrapy安装_[Python爬虫] scrapy爬虫系列 <一>.安装及入门介绍
2020-12-18 14:44

weixin_39884412的博客前面介绍了很多Selenium基于自动测试的Python爬虫程序，主要利用它的xpath语句，通过分析网页DOM树结构进行爬取内容，同时可以结合Phantomjs模拟浏览器进行鼠标或键盘操作。但是，更为广泛使用的Python爬虫框架是...
没有解决我的问题, 去提问

悬赏问题

¥15 使用C#，asp.net读取Excel文件并保存到Oracle数据库
¥15 C# datagridview 单元格显示进度及值
¥15 thinkphp6配合social login单点登录问题
¥15 HFSS 中的 H 场图与 MATLAB 中绘制的 B1 场部分对应不上
¥15 如何在scanpy上做差异基因和通路富集？
¥20 关于#硬件工程#的问题，请各位专家解答！
¥15 关于#matlab#的问题：期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707，使系统具有较小的超调量
¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
¥30 截图中的mathematics程序转换成matlab
¥15 动力学代码报错，维度不匹配

没有进行筛选，scrapy-Request callback不调用，跪求大神指点！！！

1条回答 默认 最新

悬赏问题

1条回答默认最新