scrapy中请求携带json与request有什么区别？【赏】

上面两幅图，第二幅为request版本，一切正常能够得到数据，第一幅为scrapy版本

目前百度已参考：（实际百度了很多）

http://www.cocoachina.com/articles/69939

https://www.cnblogs.com/qiaoer1993/p/10802735.html

https://www.v2ex.com/t/533939

集中方法在，请求头加json那个，第二就是什么body，method指定，都试过了，奇怪。

究竟有什么区别？怎么才能改正确？

request代码如下

import scrapy
import json
import requests


class BxwSpiderSpider(scrapy.Spider):
    name = 'bxw_spider'

    api_headers = {
        'Host': 'mpapi.baixing.com',
        'Connection': 'keep-alive',
        'Content-Length': '24',
        'BAIXING-SESSION': '$2y$10$iYbdcOD0tqZQWK1ITZc6PuIMfVDUsxItUQwepiF1VyC00ti24fPcG',
        'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.143 Safari/537.36 MicroMessenger/7.0.9.501 NetType/WIFI MiniProgramEnv/Windows WindowsWechat',
        'content-type': 'application/json',
        'env_version': '7.0.9',
        'model': 'microsoft',
        'network_type': 'wifi',
        'os': 'Windows',
        'os_version': '10',
        'source': '70',
        'source_params': '',
        'source_path': '',
        'template_version': 'Ver1.3.6',
        'track_id': '1607997570581-6558221-0b293e26ae2048-15816961',
        'udid': 'a382863f-92eb-45aa-a2b0-bca844ca6dd9',
        'Referer': 'https://servicewechat.com/wxd9808e2433a403ab/42/page-frame.html',
        'Accept-Encoding': 'gzip, deflate, br',
    }

    url = 'https://mpapi.baixing.com/v1.3.6/'  # API接口

    def start_requests(self):
        index_json = '{"listing.getAds": {"areaId": "m28", "categoryId": "gongzuo", "page": 1}}'  # 2 3

        # yield scrapy.Request(
        #     url=self.url,
        #     headers=self.api_headers,
        #     method='POST',
        #     body=index_json,
        #     callback=self.parse,
        #     dont_filter=True)

        yield scrapy.FormRequest(
            url=self.url,
            headers=self.api_headers,
            formdata=eval(index_json),
            callback=self.parse,
            dont_filter=True)

    def parse(self, response):
        print('程序进入')
        res_json = json.dumps(response.text)
        print(res_json)

scrapy代码如下：

import scrapy
import json
import requests


class BxwSpiderSpider(scrapy.Spider):
    name = 'bxw_spider'

    api_headers = {
        'Host': 'mpapi.baixing.com',
        'Connection': 'keep-alive',
        'Content-Length': '24',
        'BAIXING-SESSION': '$2y$10$iYbdcOD0tqZQWK1ITZc6PuIMfVDUsxItUQwepiF1VyC00ti24fPcG',
        'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.143 Safari/537.36 MicroMessenger/7.0.9.501 NetType/WIFI MiniProgramEnv/Windows WindowsWechat',
        'content-type': 'application/json',
        'env_version': '7.0.9',
        'model': 'microsoft',
        'network_type': 'wifi',
        'os': 'Windows',
        'os_version': '10',
        'source': '70',
        'source_params': '',
        'source_path': '',
        'template_version': 'Ver1.3.6',
        'track_id': '1607997570581-6558221-0b293e26ae2048-15816961',
        'udid': 'a382863f-92eb-45aa-a2b0-bca844ca6dd9',
        'Referer': 'https://servicewechat.com/wxd9808e2433a403ab/42/page-frame.html',
        'Accept-Encoding': 'gzip, deflate, br',
    }

    url = 'https://mpapi.baixing.com/v1.3.6/'  # API接口

    def start_requests(self):
        index_json = '{"listing.getAds": {"areaId": "m28", "categoryId": "gongzuo", "page": 1}}'  # 2 3

        # yield scrapy.Request(
        #     url=self.url,
        #     headers=self.api_headers,
        #     method='POST',
        #     body=index_json,
        #     callback=self.parse,
        #     dont_filter=True)

        yield scrapy.FormRequest(
            url=self.url,
            headers=self.api_headers,
            formdata=eval(index_json),
            callback=self.parse,
            dont_filter=True)

    def parse(self, response):
        print('程序进入')
        res_json = json.dumps(response.text)
        print(res_json)

之前爬另外一个网站，也是POST种携带请求参数，request版本就能成功，scrapy就是不行，是我使用姿势不对？

非常疑惑，百度过很多了！！！

展开全部

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

11条回答默认最新

放风喽 2020-12-16 05:32

关注

兄弟，半个小时的辛苦

class CeshiSpider(scrapy.Spider):
    name = 'ceshi'
    api_headers = {
        'Host': 'mpapi.baixing.com',
        'BAIXING-SESSION': '$2y$10$iYbdcOD0tqZQWK1ITZc6PuIMfVDUsxItUQwepiF1VyC00ti24fPcG',
        'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.143 Safari/537.36 MicroMessenger/7.0.9.501 NetType/WIFI MiniProgramEnv/Windows WindowsWechat',
        # 'content-type': 'application/json',
        # 'Content-Length': '24',
        'Referer': 'https://servicewechat.com/wxd9808e2433a403ab/42/page-frame.html',
    }

    url = 'https://mpapi.baixing.com/v1.3.6/'  # API接口
    def start_requests(self):
        index_json = {"listing.getAds": {"areaId": "m28", "categoryId": "gongzuo", "page": 1}}  # 2 3

        yield scrapy.Request(
            url=self.url,
            method="POST",
            headers=self.api_headers,
            body=json.dumps(index_json),
            callback=self.parse,
            dont_filter=True)

    def parse(self, response):
        print("下面是结果")
        print(response.text)

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(10条)

编辑

预览

报告相同问题？

关注问题

Python中scrapy.FormRequest老是返回400错误响应 python
2022-09-17 13:20

回答 2 已采纳你可以参考下这篇文章：scrapy框架中的Request()、FormRequest()、FormRequest.from_response()的小结
关于#pythonscrapy#的问题，如何解决？ python 开发语言爬虫
2023-04-02 08:26

回答 2 已采纳好问题！！抱歉我也不太懂，你问问chatGPT吧：https://new.quke123.com/ 或者其他Python群友：https://app.yinxiang.com
爬虫scrapy框架爬不出来，但是request可以出来 http python 爬虫
2022-05-05 16:26

回答 2 已采纳你应该继承 scrapy.SpiderCrawlSpider 不要自定义 parse 函数。
Scrapy JSON请求
2020-03-26 08:33

Chen.Junbao的博客以下步骤建议在写python代码前用 scrapy shell 进行尝试。 Request 请求首先对目标网站进行请求： scrapy shell <url> 之后使用xpath语法进行标签内容提取： In [1]: response.xpath(<xpath_info>) Out...
scrapy中start_requests指定回调函数为何没有调用 python 有问必答爬虫
2022-01-20 15:02

回答 2 已采纳改成这样试试 yield scrapy.Request(url=login_url, headers=header, body=json.dumps(param), method='
请问Python爬虫如何把爬取数据存入csv文件中 python 开发语言有问必答爬虫
2021-11-21 13:19

回答 1 已采纳你用open打开csv文件，然后以字符串格式写入就行了，每个数据之间用英文逗号隔开即可
爬虫中加入请求头导致报错:'str' object has no attribute 'items python
2019-10-14 14:53

回答 2 已采纳 headers应该是个dict，例如 ```python #设定请求头中的浏览器标识 headers={"User-Agent": "Mozilla/5.0 (Windows NT 6.1;
scrapy中Request请求使用Request payload参数 json或text
2018-10-24 02:06

Voccoo的博客如下图所示，在这个请求中，payload中有个参数在F12中有个‘str’=null的参数，在大家需要写的时候，如果真的在dict中也这么写，很容易会出现问题的。要不返回400，要不没有数据。那么在这里详细的说下在scrapy中...
python抓取405错误 python 有问必答爬虫
2022-01-07 08:37

回答 2 已采纳建议使用requests,添加参数headers,cookies，params,这样试一下。
用python requests.post（）实现翻页，表单上传后返回数据缺失 python 有问必答
2021-11-27 11:50

回答 1 已采纳 1.需要传cookies参数,2.data数据的即字典的值都要写成字符串。获取json后再从中用bs4解析出数据。参考如下代码： import requests cookies = { 'P
爬Ajax地址的结果与network代码不同，缺失一部分变成null怎么解决？ ajax python 有问必答爬虫
2022-03-27 11:53

回答 2 已采纳没问题啊？ import requests import time headers = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win
Python的requests.post 的data和json参数到底有什么区别？
2023-02-10 06:55

齐天小胜的博客代码很简单，但是服务器一直提示错误，客户端收不到结果然后加上header参数，再次进行调试经过反复调试，把代码改成下面的方法就可以了回头想想，问题的根本解决是把requests.post 的参数 “data”改成了“json”。
Scrapy发送POST请求携带Request Payload参数
2021-09-18 04:07

lemuzhi_零度的博客报错3：说无法解压缩，不可编辑的int对象，这是啥，莫非是我传的参数有问题？反复检查，怀疑人生中...... 报错4：返回405，并且是一个GET请求，？？？，FormRequest不是POST请求吗，怎么变成了GET请求？又是一顿...
python使用scrapy发送post请求的坑
2020-09-19 19:23

在Python的Web爬虫开发中，Scrapy框架和requests库都是常用工具，它们在处理HTTP请求时各有特点。本文将重点讨论使用Scrapy发送POST请求时可能会遇到的问题以及与requests库的不同之处。首先，让我们回顾一下...
scrapy.Request（）post方式发送json数据
2021-12-17 02:19

始識的博客再scrapy 中可以使用formdata 发送post请求但是也仅限于formdata 方式的数据但是如果post请求要求传递json 单纯使用下列方式是提取不出来出数据的 def start_requests(self): for i in range(1000): ...
没有解决我的问题, 去提问

码龄粉丝数原力等级 --

scrapy中请求携带json与request有什么区别？【赏】

11条回答默认最新

码龄粉丝数原力等级 --

scrapy中请求携带json与request有什么区别？【赏】

11条回答 默认 最新

11条回答默认最新