请问需要获取登录后的内容，是在cookies吗，应该怎么加呢

这是爬虫部分，
我想要获取30页的内容，但是不登录只能获取10页的内容，我看是需要加cookie,
但是应该怎么加呢，加在哪儿

#import scrapy
#from demo1.items import Demo1Item

#class BaiduSpider(scrapy.Spider):

name = 'baidu'

#allowed_domains = ['daidu.com']
#page_num = 15
#url = 'https://www.liepin.com/zhaopin/?&dq=280020&currentPage='
#start_urls = [url + str(page_num)]
print(start_urls)

def parse(self, response):
    li_list = response.xpath('//div[@class="left-list-box"]/ul/li')

    for li in li_list:
        item = Demo1Item()
        # print(li)
        name =li.xpath('.//div[@class="job-title-box"]/div/@title')[0].extract()
        print(name)
        # 获取工作地点
        location =li.xpath('.//div[@class="job-dq-box"]/span[@class="ellipsis-1"]/text()')[0].extract()
        print(location)

        item = Demo1Item()
        item['name'] = name
        item['location'] = location

        #将item提交给管道
        yield item

        self.page_num += 1
        yield scrapy.Request(self.url + str(self.page_num),callback = self.parse,dont_filter = True)

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
A Python 萌新花花 2022-02-04 09:58
关注
加在request那块吧

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python登录后获取cookie_python 获取登录后的cookie
2020-12-29 10:22

阿潇咿呀呀的博客 return r.cookies.get_dict() #获取session的代码举个栗子：```import getcwdimport osimport requestsimport hashlibimport configparserclass GetSession():# 从配置文件获取URLpath = getcwd.get_cwd()config_...
python获取登录后的cookie_python爬虫使用cookie登录详解
2020-11-30 03:21

weixin_39668898的博客比如说有些网站需要登录后才能访问某个页面，在登录之前，你想抓取某个页面内容是不允许的。那么我们可以利用Urllib库保存我们登录的Cookie，然后再抓取其他页面,这样就达到了我们的目的。一、Urllib库简介Urllib是...
python 打开网页获取cookies_python 携带cookie获取页面内容
2020-11-30 03:23

weixin_39525255的博客有时会遇到爬取的页面需要登录，这就要带上cookie了。下面记录了几种携带cookie的方法# coding=utf-8import requestss = requests.Session()login_data = {'username': 'teacher', 'password': 'teacher'}# 方法1# ...
Python网络爬虫：使用Cookie获取登录后的页面数据
2024-11-20 14:15

Selina .a的博客由于许多网站的内容在登录后才能访问，因此，模拟用户登录并维护会话状态（通常通过Cookie）成为网络爬虫的关键任务之一。本文将详细讲解如何使用Python网络爬虫，特别是requests库，来处理Cookie并获取登录后的页面...
python 打开网页获取cookies_python怎么获取网页的cookie(cookies)
2020-11-30 03:24

weixin_39918682的博客 python获取网页cookies的方法：# _*_ coding: utf-8 _*_#引用要使用到的库import requestsimport timefrom selenium import webdriverfrom selenium.webdriver.common.keys import Keys#定义好登陆使用的用户名与...
python登录网站后爬取数据_需要登陆网站后才能获取数据的页面爬取
2020-12-03 07:06

weixin_39640085的博客本文需要学习的地方,使用三种不同的方式爬取需要登录才能获取数据的网站数据POST 请求方法：需要在后台获取登录的 URL并填写请求体参数，然后 POST 请求登录，相对麻烦；添加 Cookies 方法：先登录将...
python获取chrome里的cookies
2024-05-10 14:34

夏末蝉未鸣01的博客这段代码只能在Windows系统运行。
python+selenium获取cookie session_Selenium获取登录Cookies并添加Cookies自动登录的方法
2020-12-08 15:31

weixin_39664585的博客本章中用到的关键方法如下：get_cookies()：获得所有cookie信息。get_cookie(name)：返回字典的key为“name”的cookie信息。add_cookie(cookie_dict)：添加cookie。“cookie_dict”指字典对象，必须有name 和...
python模拟登录获取Cookie
2021-06-25 16:29

Roc-xb的博客在自动化处理过程中，有些操作往往需要登录之后才能进一步操作，所以我们需要通过登录获取到cookies信息，因为登录信息一般都是保存到cookies当中的，我们只需要在登录完成后把请求返回的cookies放到需要登录的url...
python脚本根据cookies自动登录网站_python爬虫使用cookie登录详解
2020-11-24 00:19

weixin_39791322的博客比如说有些网站需要登录后才能访问某个页面，在登录之前，你想抓取某个页面内容是不允许的。那么我们可以利用Urllib库保存我们登录的Cookie，然后再抓取其他页面,这样就达到了我们的目的。一、Urllib库简介包括以下...
python模拟登录网站_用python模拟登录网站获取cookies（urllib与requests）
2020-11-24 00:21

weixin_39631899的博客最近在学习使用python爬取网页信息，之前也写了几篇网站爬取以及图文混排爬取到word中的例子，有兴趣的可以在本站搜索python。...对于这种需要登录才能获取内容的网站，目前接触到两种方法，第一种是使用 Selenium库...
Python爬虫 - Selenium（12）获取登录Cookies，并添加Cookies自动登录
2019-12-29 21:04

程序猿杂记的博客 WebDriver提供了操作Cookie的相关方法，可以读取、添加和删除cookie信息，以下将分别介绍一下`模拟登陆并获取Cookies`、`添加Cookies自动登录`两个小例子。
python爬虫学习笔记，通过html标签获取网页内容
2023-03-20 11:36

bs4 通过html标签获取网页内容、Xpath解析、模拟登录cookies、多线程，多进程、selenium的使用
在使用Python的Selenium库打卡网页后，通过CDP命令获取所有cookies(包括Httponly和Secure的cookies)
2025-04-28 21:19

guangdeshishe的博客常见问题返回空列表：确保浏览器已加载过页面（部分 Cookies 可能在页面加载后生成）。检查浏览器隐私设置（如隐身模式下可能无 Cookies）。安全限制：部分 Cookies 可能标记为 HttpOnly 或 Secure，但 CDP ...
Python爬虫登录后cookie处理
2023-01-08 22:23

永远是少年啊的博客今天继续给大家介绍Python爬虫相关知识，本文主要内容是Python爬虫登录后cookie处理。一、cookie在登录操作中的作用二、引入session对象解决登录后访问问题三、Python爬虫登录实战
用Python获取浏览器Cookies的多种方式
2024-05-16 15:49

程序员霄霄的博客本文介绍了使用Python获取浏览器Cookies的多种方式，包括使用Selenium库、浏览器开发者工具、浏览器插件、浏览器驱动程序等。每种方式都有其适用的场景和注意事项，你可以根据具体需求选择合适的方法。行动吧，在...
python获取浏览器 cookies
2022-07-07 12:08

.Passion的博客 python 获取 cookie
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月29日

请问需要获取登录后的内容，是在cookies吗，应该怎么加呢

name = 'baidu'

1条回答 默认 最新

问题事件

1条回答默认最新