scrapy中start_requests指定回调函数为何没有调用

###### 问题遇到的现象和发生背景
ef start_requests(self):
        login_url = 'https://antispider7.scrape.center/api/login'
        header = {
            'Content-Type': 'application/json;charset=UTF-8',
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.159 Safari/537.36',
        }
        param = {
            'password': 'admin',
            'username': 'admin',
        }
        yield scrapy.Request(url=login_url, headers=header, body=json.dumps(param), method='POST', callback=self.login_callback)

    def login_callback(self, response):
        print(response.text)
        jwt = 'jwt ' + json.loads(response.text)['token']
        header = {
            'Authorization': jwt
        }
        for page in range(1, 3):
            url = 'https://antispider7.scrape.center/api/book/?limit=18&offset=%s' % ((page-1) * 18)
            yield scrapy.Request(url=url, headers=header, callback=self.parse_list)

    def parse_list(self, response):
        print(response.text)
        results = json.loads(response.text)
        for result in results['results']:
            book_id = result['id']
            title = result['name']
            score = result['score']
            author = ''.join(result['author']).replace('\n', '').replace('\t', '').replace('\r', '')
            outurl = result['cover']
            print(book_id, title, score, author, outurl)

问题相关代码，请勿粘贴截图

我需要先登录获取token加入到header中，因此我选择使用startr_requests来完成，但是yield之后始终没有任何回调函数捕捉到，请问可能的原因是什么？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

CSDN专家-天际的海浪 2022-01-20 23:51

关注

改成这样试试


        yield scrapy.Request(url=login_url, headers=header, body=json.dumps(param), method='POST', callback=lambda x,s=self: s.login_callback(x))

你题目的解答代码如下：

    def start_requests(self):
        login_url = 'https://antispider7.scrape.center/api/login'
        header = {
            'Content-Type': 'application/json;charset=UTF-8',
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.159 Safari/537.36',
        }
        param = {
            'password': 'admin',
            'username': 'admin',
        }
        yield scrapy.Request(url=login_url, headers=header, body=json.dumps(param), method='POST', callback=lambda x,s=self: s.login_callback(x))
 
    def login_callback(self, response):
        print(response.text)
        jwt = 'jwt ' + json.loads(response.text)['token']
        header = {
            'Authorization': jwt
        }
        for page in range(1, 3):
            url = 'https://antispider7.scrape.center/api/book/?limit=18&offset=%s' % ((page-1) * 18)
            yield scrapy.Request(url=url, headers=header, callback=lambda x,s=self: s.parse_list(x))
 
    def parse_list(self, response):
        print(response.text)
        results = json.loads(response.text)
        for result in results['results']:
            book_id = result['id']
            title = result['name']
            score = result['score']
            author = ''.join(result['author']).replace('\n', '').replace('\t', '').replace('\r', '')
            outurl = result['cover']
            print(book_id, title, score, author, outurl)

如有帮助，请点击我的回答下方的【采纳该答案】按钮帮忙采纳下，谢谢!

本回答被题主选为最佳回答 , 对您是否有帮助呢?

编辑记录

查看更多回答(1条)

报告相同问题？

关注问题

scrapy中start_requests指定回调函数为何没有调用 python 有问必答爬虫
2022-01-20 23:02

回答 2 已采纳改成这样试试 yield scrapy.Request(url=login_url, headers=header, body=json.dumps(param), method='
scrapy如何传入start_requests python 爬虫
2021-12-28 15:45

回答 1 已采纳获取到翻页的url之后调用start_request不就传了，求采纳，谢谢🙈🙈🙈
Scrapy的下载中间件返回响应对象时，为什么不会执行 del 操作？ python selenium 有问必答
2021-04-22 17:43

回答 4 已采纳已经解决，创建中间件时请使用 `spider_closed`方法并连接到信号： --skip-- @classmethod def from_crawler(cls, crawler):
scrapy的start_requests无法运行
2019-10-23 17:41

Jayj1997的博客今天犯了一个终极沙雕的错误，沙雕到不能再沙雕，scrapy写的爬虫无法运行下去，到了start_requests就跳过了，最后发现是start_requests写成了start_request，我的老妈啊我几个小时就因为一个s嗝屁了ORZ ...
在scrapy中能不能进行多次post请求？ python
2020-12-13 19:29

回答 1 已采纳通过scrapy 可以多次发送 post 请求的，在start_requests方法中通过 yield 去调用另一个方法即可
Python中scrapy.FormRequest老是返回400错误响应 python
2022-09-17 21:20

回答 2 已采纳你可以参考下这篇文章：scrapy框架中的Request()、FormRequest()、FormRequest.from_response()的小结
怎么解决Python中scrapy导入出错的问题？ pycharm python
2021-07-14 22:31

回答 1 已采纳看提示是说没有 crawl 命令，要解决这个问题，需要确保2点： 1.把爬虫.py复制到spiders文件夹里如执行scrapy crawl demo ,spiders里面就要有demo.py文件
Day 24 24.3 Scrapy框架进阶之start_requests重写
2023-04-19 10:16

Chimengmeng的博客 Scrapy框架进阶之start_requests...scrapy中start_url是通过start_requests来进行处理的，其实现代码如下 def start_requests(self): cls = self.__class__ if method_is_overridden(cls, Spider, 'make_req...
python爬虫scrapy python 有问必答
2021-07-22 10:03

回答 2 已采纳看下数据是否是动态加载的，多抓几次包，分析下；可能需要通过添加page参数，进行爬取！
python scrapy爬虫如果想要下一页但是没有href python 爬虫
2022-12-14 00:18

回答 1 已采纳你要模拟参数，具体代码如下： import http.client conn = http.client.HTTPSConnection("chl.cn") #page 5 #submit 下一页
python的requests请求连接中包含*怎么处理啊 python
2022-05-08 23:02

回答 3 已采纳链接如果没错的话直接在*前面加上反斜杠\ 转义
python scrapy request_python – Scrapy Start_request解析
2020-12-08 10:18

weixin_39723655的博客我从Scrapy的start_requests开始,我将传递搜索查询并重定向到另一个函数解析,该解析将从搜索结果中检索URL.最后我调用另一个函数parse_item来解析结果.我能够提取所有搜索结果url,但我无法解析结果(parse_item不起...
scrapy通用爬虫parse解析中的问题 python 爬虫
2022-10-16 01:14

回答 1 已采纳检查一下parse item 函数的response是否是正常的
Scrapy系列二：重写start_reuests()方法，伪装和重设解析数据回调函数
2020-03-28 23:37

qq_41622603的博客重设解析数据回调函数：在系列一文章里面我们把爬虫的数据解析的具体实现写在了Scrapy默认的parse方法里，如果要指定别的数据解析回调函数，则需要指定新的解析数据的回调函数 重写start_requests()方法在系列...
【python|scrapy】yield scrapy.Request在自定义函数中调用没有执行
2022-09-14 22:16

胡侃有料的博客 yield scrapy.Ruequest自定义函数中调用不被执行
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 3月24日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月16日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月20日

悬赏问题

¥60 许可证msc licensing软件报错显示已有相同版本软件，但是下一步显示无法读取日志目录。
¥15 Attention is all you need 的代码运行
¥15 一个服务器已经有一个系统了如果用usb再装一个系统，原来的系统会被覆盖掉吗
¥15 使用esm_msa1_t12_100M_UR50S蛋白质语言模型进行零样本预测时，终端显示出了sequence handled的进度条，但是并不出结果就自动终止回到命令提示行了是怎么回事：
¥15 前置放大电路与功率放大电路相连放大倍数出现问题
¥30 关于<main>标签页面跳转的问题
¥80 部署运行web自动化项目
¥15 腾讯云如何建立同一个项目中物模型之间的联系
¥30 VMware 云桌面水印如何添加
¥15 用ns3仿真出5G核心网网元

scrapy中start_requests指定回调函数为何没有调用

问题相关代码，请勿粘贴截图

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新