scrapy运行没有结果的问题

Python爬虫scrapy框架中运行显示不出结果，不报错 (用scrapy模拟cookie登陆的问题)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2023-05-11 02:05
关注
你可以看下这个问题的回答https://ask.csdn.net/questions/1057436
这篇博客你也可以参考下：scrapy框架中cookie的设置路径
除此之外, 这篇博客: Python中Scrapy框架中的 1、 cookie 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:
在整个框架运作前，需要一个启动条件，这个启动条件就是start_urls，首先从start_urls的网页发起requests请求，才会有后面的调度器、下载器、爬虫、管道的运转。所以，这里我们可以针对start_urls进行网络请求的start_requests方法进行重写，把我们的cookie给携带进去

注意：必须要使用yield返回，不然没办法运行

import scrapy class ExampleSpider(scrapy.Spider): name = 'example' # allowed_domains = ['example.com'] start_urls = ['https://www.baidu.com'] # 重写start_request方法，scrapy从这里开始 def start_requests(self): # 添加cookie的第一种方法，直接添加 cookie = " " cookie_dic = {} for i in cookie.split(";"): cookie_dic[i.split("=")[0]] = i.split("=")[1] # 添加cookie的第二种方法：添加头部 headers = { "cookie": "cookie_info", # 使用headers传入cookie时，要在settings中加入COOKIES_ENABLE = True } for url in self.start_urls: yield scrapy.Request(url=url, callback=self.parse, headers=headers) # 添加cookies def parse(self, response): print(response.text)

您还可以看一下龙豪杰老师的Python网络爬虫课程中的获取cookie对象小节, 巩固相关知识点
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

关于Scrapy 框架运行不出结果的问题，好像没有报错 python 正则表达式
2020-05-09 18:12

回答 3 已采纳如图：如果你完整的看完scrapy的日志（第一张图），根本原因：你设置了robotstxt服从为真，直接原因：目标网站的robot限制了你的访问
scrapy运行发生错误，如何解决？ python 爬虫
2022-07-28 20:29

回答 1 已采纳重新安装一下lxml库呢https://blog.csdn.net/weixin_43965374/article/details/99641332
scrapy安装失败的问题 python 有问必答
2021-04-17 21:20

回答 4 已采纳 can't find Rust compiler，找不到Rust编译器
python-scrapy安装问题详解
2017-11-29 15:21

在学习和使用Scrapy之前，通常需要先掌握Python编程语言，并对Scrapy的安装有一个明确的了解。由于Scrapy是一个独立于Python版本的框架，因此在安装时会涉及到对不同Python版本的考虑。本文档将详细解析在安装Scrapy...
scrapy-爬取京东笔记本电脑信息问题 chrome python selenium 开发语言
2020-09-01 19:12

回答 2 已采纳 ``` browser.quit() return HtmlResponse(url=request.url, body=browser.page_source, re
scrapy怎么没打印数据？ python
2021-07-21 12:31

回答 3 已采纳 allowed_domains = ["jobui.com"] 好像是不要WWW 或者这个直接不写 allowed_domains = ["jobui.com"]
关于scrapy 无法启动的问题 python
2022-08-22 21:07

回答 2 已采纳这是在两个不同py文件，要使用CnblogspiderItem需要导入另一个文件在Cnblog...py文件开头导入另一个文件import Item（反正就是另一个文件的文件名，图片模糊有些看不清）
精通Scrapy网络爬虫_python_scrapy_
2021-09-29 12:32

在深入理解Scrapy之前，我们首先需要了解Python的基础知识，因为它是Scrapy的编程语言基础。 Python是一种高级编程语言，以其简洁、易读的语法而闻名，特别适合初学者入门。Scrapy基于Python，因此掌握Python的基本...
关于#pythonscrapy#的问题，如何解决？ python 开发语言爬虫
2023-04-02 16:26

回答 2 已采纳好问题！！抱歉我也不太懂，你问问chatGPT吧：https://new.quke123.com/ 或者其他Python群友：https://app.yinxiang.com
scrapy通用爬虫parse解析中的问题 python 爬虫
2022-10-16 01:14

回答 1 已采纳检查一下parse item 函数的response是否是正常的
python scrapy爬虫如果想要下一页但是没有href python 爬虫
2022-12-14 00:18

回答 1 已采纳你要模拟参数，具体代码如下： import http.client conn = http.client.HTTPSConnection("chl.cn") #page 5 #submit 下一页
scrapy_Python的爬虫框架Scrapy_scrapy_
2021-10-03 15:08

Scrapy是Python编程语言中的一款强大且高效的网页抓取框架，专为数据抓取和爬虫项目设计。它提供了一整套工具集，使得开发者能够快速构建起复杂的网络爬虫，处理网页数据并进行分析。在本文中，我们将深入探讨Scrapy...
flask+scrapy的爬虫问题 flask json python 爬虫
2018-01-29 07:55

回答 3 已采纳你拿到参数后先写一个bat批处理 scrapy crawl myspider -a category=electronics 再 os.system(r'xx.bat') 来调用 https://d
Python快乐编程-网络爬虫
2024-01-26 10:43

同时，要学会处理可能出现的异常，如网络连接错误、编码问题等，确保爬虫的稳定运行。最后，随着网络爬虫技术的发展，多线程和异步IO（如使用asyncio库）的应用越来越广泛，它们能显著提高爬虫的效率。此外，...
Python爬虫基础讲解（二十三）：scrapy框架简介
2021-06-17 15:14

松鼠爱吃饼干的博客 scrapy是一个使用Python语言（基于Twisted框架）编写的开源网络爬虫框架，目前由 scrapinghub Ltd维护。Scrapy简单易用、灵活易拓展、开发社区活跃，并且是跨平台的。在Linux、MaxOS以及windows平台都可以使用。 ...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月11日

悬赏问题

¥15 关于将inet引入的相关问题
¥15 关于一个倒计时的操作和显示设计
¥15 提问STK的问题，哪位航天领域的同学会啊
¥15 苹果系统的mac m1芯片的笔记本使用ce修改器使用不了
¥15 单相逆变的电压电流双闭环中进行低通滤波PID算法改进
¥15 关于#java#的问题，请各位专家解答！
¥15 如何卸载arcgis 10.1 data reviewer for desktop
¥15 共享文件夹会话中为什么会有WORKGROUP
¥15 关于#python#的问题：使用ATL02数据解算光子脚点的坐标(操作系统-windows)
¥115 关于#python#的问题：未加密前两个软件都可以打开，加密后只有A软件可打开，B软件可以打开但读取不了数据

scrapy运行没有结果的问题

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新