Scrapy 中关于 request 和 yield 的问题，求大佬帮忙··

我目前需要爬取某个网页的一些指标，其中有一个是判断网页中是否有robots.txt文件，这个指标我的判断的方法是访问’www.baidu.com/robots.txt‘，根据其response.code判断，但是我想把这个指标和其他指标放到一个item里，请问应该怎么做。

我本想用yield scrapy.request（‘www.baidu.com/robots.txt’）来操作，但是获取不到其返回值，而且yield和return不能同时存在，望各位大佬解答一下，万分感激。

鄙人QQ642026725，欢迎各位大佬指导，萌新不胜感激

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

报告相同问题？

关注问题

scrapy通用爬虫parse解析中的问题 python 爬虫
2022-10-16 01:14

回答 1 已采纳检查一下parse item 函数的response是否是正常的
关于#scrapy#的问题，如何解决？ python 爬虫
2023-03-07 18:36

回答 2 已采纳从代码看，你的爬虫似乎只是爬取了起始页面上第一个标题链接的数据。这可能是因为在parse函数中只获取了第一个数据块，而没有对其他数据块进行处理。你可以尝试使用循环迭代数据块，以便对每个数据块进行相同
关于scrapy 无法启动的问题 python
2022-08-22 21:07

回答 2 已采纳这是在两个不同py文件，要使用CnblogspiderItem需要导入另一个文件在Cnblog...py文件开头导入另一个文件import Item（反正就是另一个文件的文件名，图片模糊有些看不清）
scrapy中关于POST请求的问题
2021-07-29 02:13

Lemon_guess的博客首先谈一下常规情况，常规方法： #手动提交post class LoginSpider(scrapy.Spider): name = 'login' #allowed_domains = ['... def start_requests(self): #手动发送post请求 yield scrapy.FormRequest(u
关于#pythonscrapy#的问题，如何解决？ python 开发语言爬虫
2023-04-02 16:26

回答 2 已采纳好问题！！抱歉我也不太懂，你问问chatGPT吧：https://new.quke123.com/ 或者其他Python群友：https://app.yinxiang.com
scrapy中请求携带json与request有什么区别？【赏】 python
2020-12-15 11:12

回答 4 已采纳兄弟，半个小时的辛苦 class CeshiSpider(scrapy.Spider): name = 'ceshi' api_headers = { 'Host'
关于Scrapy 框架运行不出结果的问题，好像没有报错 python 正则表达式
2020-05-09 18:12

回答 3 已采纳如图：如果你完整的看完scrapy的日志（第一张图），根本原因：你设置了robotstxt服从为真，直接原因：目标网站的robot限制了你的访问
5.2-python爬虫之CrawlSpider&Scrapy Shell&Request和Response对象
2021-08-23 08:56

Nosimper的博客文章目录系列文章目录前言一、CrawlSpider爬虫1、创建CrawlSpider爬虫：2、LinkExtractors链接提取器：3、Rule规则类：4、微信小程序社区CrawlSpider案例二、Scrapy Shell1、打开Scrapy Shell三、Request和Response...
怎么解决Python中scrapy导入出错的问题？ pycharm python
2021-07-14 22:31

回答 1 已采纳看提示是说没有 crawl 命令，要解决这个问题，需要确保2点： 1.把爬虫.py复制到spiders文件夹里如执行scrapy crawl demo ,spiders里面就要有demo.py文件
scrapy配置问题,求大家帮忙啊 python
2013-11-20 03:11

回答 3 已采纳按照上面安装的方法，需要安装 pywin32-218.win32-py2.7.exe Twisted-13.1.0.win32-py2.7.exe zope.interface-4.0.
用scrapy.Request怎么抓取JS动态页面 python
2022-01-03 10:32

回答 1 已采纳 self.xidian_next_page确定有值吗
用Scrapy和Selenium爬取动态数据
2022-06-23 10:40

爱吃雪糕的小布丁的博客文章参考千锋教育大佬的课程： https://www.bilibili.com/video/BV1QY411F7Vt?p=1&vd_source=5f425e0074a7f92921f53ab87712357b ，多谢大佬的课程因为Taobao网的搜索功能需要登录之后才能使用，所以我们要通过...
scrapy-redis记录之，重写make_request_from_data和make_requests_from_url
2020-12-27 19:52

python实验室的博客 scrapy-redis记录，重写make_request_from_data和make_requests_from_url 起因是最近爬了某电商商品，因为用了scrapy-redis来爬，这样...经过搜索和大佬的经验，重写了make_request_from_data和make_requests_from_ur
【一】python3+Scrapy：爬虫框架问题合集【参考转载大佬文章 + 自己解决方法】
2023-05-03 10:06

温柔夏目的博客重新请求......') return request 3、同一个网站，同一个请求头，request可以成功，scrapy却不行我自己的试过所有方法都不行，最后在scrapy中请求，host放到第一个就可以了 4、报错：[scrapy.core.scraper] ERROR: ...
scrapy 如何使用代理以及设置超时时间
2022-11-17 10:15

始識的博客使用代理 1. 单文件spider局部使用代理 entry = 'http://xxxxx:xxxxx@http-pro.abuyun.com:xxx'.format("帐号", "密码","端口号") ...# 传参meta迭代下一个方法 for url in self.starturl: yield sc...
没有解决我的问题, 去提问

悬赏问题

¥15 stata安慰剂检验作图但是真实值不出现在图上
¥15 c程序不知道为什么得不到结果
¥40 复杂的限制性的商函数处理
¥15 程序不包含适用于入口点的静态Main方法
¥15 素材场景中光线烘焙后灯光失效
¥15 请教一下各位，为什么我这个没有实现模拟点击
¥15 执行 virtuoso 命令后，界面没有，cadence 启动不起来
¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
¥20 有关区间dp的问题求解
¥15 多电路系统共用电源的串扰问题

码龄粉丝数原力等级 --

Scrapy 中关于 request 和 yield 的问题，求大佬帮忙··

0条回答默认最新

悬赏问题

Scrapy 中关于 request 和 yield 的问题，求大佬帮忙··

0条回答 默认 最新

悬赏问题

0条回答默认最新