python写爬虫遇到"脚本可访问"属性的cookies怎么办？

最近在用python做网页模拟登陆的时候遇到一些问题。
1.cookies方面的：
当访问某个网页的子页时候往往需要发送一些cookies，这些cookies大多数能在response headers里面找到(set cookies)，但是有一些属性是“脚本可访问”的却没有在在headers里面找到(即使已经清空了缓存的该网站的所有cookies)，想知道这些cookies是怎么来的。JS脚本里面生成的吗？在python里面应该要怎么样得到这些cookies？

2.关于用post发送payload的问题：
在开发者工具里面发现网页发送的payload是分层次的而不是并列出现(见下图)，这种情况在python里面写的时候要用什么格式写？
图片说明
3.Query String Parameters是什么?

刚开始学习爬虫不久，对网页结构了解不是很深，觉得先前使用开发者工具分析网站的方法不是很正确，希望大神指点迷津。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2018-06-24 16:09
关注
1你最好给一个网站，可以帮你分析你说的cookie怎么来的，因为脚本也可以附加cookie的。

2你的payload看上去好像是指json格式的post data

3Query String是指www.abc.com/page?id=xxx&name=yyy中，问号后面的那些键值对。（比如id和name）

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python后端开发或爬虫怎么系统学习？ python 后端爬虫
2023-04-13 13:18

回答 1 已采纳爬虫严格来讲并不算一个大方向，更偏向于js逆向，python的话推荐走后端方向至于系统学习的话，推荐去blibili找一些路线，然后根据路线去找bilibili上播放量比较高的视频进行系统学习
Python selenium 爬虫被检测怎么办？ python 有问必答
2022-03-12 22:42

回答 2 已采纳是不是安装的selenium模块版本不对webdriver.Chrome()返回的对象没有execute_cdp_cmd方法重新安装selenium模块新版本看看
通过python爬虫，爬取到的图片无法打开，请问要怎么办？ pycharm python
2021-08-11 23:59

回答 2 已采纳你是真的秀，没有请求图片地址获得数据肯定打不开啊，你写入的是列表的的文本的二进制，并不是图片的。应该在图片链接后面再请求一次图片网址，然后写入获得的响应数据的二进制内容，望采纳哈
python脚本根据cookies自动登录网站_Python爬虫利用cookie实现模拟登陆实例详解
2020-11-24 00:19

weixin_39898248的博客我们将MozillaCookiJar换成CookieJar试试，下面一张图你就能明白： CookieJar是没有保存save属性的~ save()这个方法中：ignore_discard的意思是即使cookies将被丢弃也将它保存下来，ignore_expires的意思是如果在该...
selenium爬虫遇到VIP页面以及爬取次数限制时该怎么办 python selenium 爬虫
2021-10-24 12:56

回答 1 已采纳遇到VIP页面，我想你应该需要一个VIP会员，并以登入破解。限制爬取次数上，可以用proxy轮转或尽量拉长sleep时间或多办几个账号以上浅见
Python爬虫可以用IDLE编写吗？ python
2021-08-09 21:50

回答 4 已采纳学习爬虫用IDLE是可以的，一般IDLE可以满足初学者的使用需求。最近我也在学爬虫，写了一些实例，可以来看看我的专栏： https://blog.csdn.net/weixin_52132159/
写完python爬虫后运行不出结果 python 有问必答爬虫
2022-02-15 05:15

回答 3 已采纳数据是动态从接口获取的，在网页中没有办法直接获取，除非用 selenium模块结合浏览器爬取动态数据 # -*- coding:utf-8 -*- import pandas as pd impor
Python如何正确解决爬虫过程中的Cookie失效问题？
2023-07-26 10:03

写python的鑫哥的博客本文是该专栏的第54篇，后面会持续分享python爬虫干货知识，记得关注。在python爬虫项目中，Cookie是一种用于在客户端和服务器之间传递信息的技术。在爬取某些网站的时候，可能会需要登录才能正常获取到数据，这个...
用python写爬虫和用Java写爬虫的区别是什么？ java python 爬虫
2016-04-26 01:53

回答 6 已采纳 python开发起来方便，快速，爬虫库也比较好用，scrapy
python爬虫html获取不全 html python 爬虫
2022-06-24 19:43

回答 1 已采纳其实有的，但是这个网站应该是为了懒加载把url用base64密了一下，然后再动态加载，其实我下面发的这个就是url 是base64后的url 解码后就是https://s1.aigei.com/
python爬虫bs4中用select如何获取属性值 python
2021-12-26 12:33

回答 2 已采纳 ```python from bs4 import BeautifulSoup import re html = """ <html><head><title>
python 爬虫遇到验证码如何解决
2022-12-12 13:25

超市dn的博客爬虫遇到验证码的问题,如何完善代码,以及遇到的问题
python爬虫爬虫的网站源码不齐全怎么办 python
2019-04-26 16:05

回答 1 已采纳现在都是动态网页,你爬取到的只是一个基本框架而已。你可以用f12 然后检测一下http请求，基本上获取到的都是第一个请求。后面的数据都是通过js修改后的网页。交互式的。所以要想做复杂爬虫，
python脚本根据cookies自动登录网站_python爬虫使用cookie登录详解
2020-11-24 00:19

weixin_39791322的博客比如说有些网站需要登录后才能访问某个页面，在登录之前，你想抓取某个页面内容是不允许的。那么我们可以利用Urllib库保存我们登录的Cookie，然后再抓取其他页面,这样就达到了我们的目的。一、Urllib库简介包括以下...
python 爬虫 cookies_Python 爬虫：Cookies 的连续获取
2021-01-28 22:36

weixin_39760689的博客问题引入日常在编写一些自用爬虫时，通常为了方便是直接从浏览器的开发者工具中调取 cookies 字符串，然后再进行字典的转换供 requests 库使用。cookiesclass transCookie:def __init__(self, cookie):self.cookie =...
没有解决我的问题, 去提问

悬赏问题

¥35 平滑拟合曲线该如何生成
¥100 c语言，请帮蒟蒻写一个题的范例作参考
¥15 名为“Product”的列已属于此 DataTable
¥15 安卓adb backup备份应用数据失败
¥15 eclipse运行项目时遇到的问题
¥15 关于#c##的问题：最近需要用CAT工具Trados进行一些开发
¥15 南大pa1 小游戏没有界面，并且报了如下错误，尝试过换显卡驱动，但是好像不行
¥15 自己瞎改改，结果现在又运行不了了
¥15 链式存储应该如何解决
¥15 没有证书，nginx怎么反向代理到只能接受https的公网网站