scrapy中请求携带json与request有什么区别？【赏】

上面两幅图，第二幅为request版本，一切正常能够得到数据，第一幅为scrapy版本

目前百度已参考：（实际百度了很多）

http://www.cocoachina.com/articles/69939

https://www.cnblogs.com/qiaoer1993/p/10802735.html

https://www.v2ex.com/t/533939

集中方法在，请求头加json那个，第二就是什么body，method指定，都试过了，奇怪。

究竟有什么区别？怎么才能改正确？

request代码如下

import scrapy
import json
import requests


class BxwSpiderSpider(scrapy.Spider):
    name = 'bxw_spider'

    api_headers = {
        'Host': 'mpapi.baixing.com',
        'Connection': 'keep-alive',
        'Content-Length': '24',
        'BAIXING-SESSION': '$2y$10$iYbdcOD0tqZQWK1ITZc6PuIMfVDUsxItUQwepiF1VyC00ti24fPcG',
        'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.143 Safari/537.36 MicroMessenger/7.0.9.501 NetType/WIFI MiniProgramEnv/Windows WindowsWechat',
        'content-type': 'application/json',
        'env_version': '7.0.9',
        'model': 'microsoft',
        'network_type': 'wifi',
        'os': 'Windows',
        'os_version': '10',
        'source': '70',
        'source_params': '',
        'source_path': '',
        'template_version': 'Ver1.3.6',
        'track_id': '1607997570581-6558221-0b293e26ae2048-15816961',
        'udid': 'a382863f-92eb-45aa-a2b0-bca844ca6dd9',
        'Referer': 'https://servicewechat.com/wxd9808e2433a403ab/42/page-frame.html',
        'Accept-Encoding': 'gzip, deflate, br',
    }

    url = 'https://mpapi.baixing.com/v1.3.6/'  # API接口

    def start_requests(self):
        index_json = '{"listing.getAds": {"areaId": "m28", "categoryId": "gongzuo", "page": 1}}'  # 2 3

        # yield scrapy.Request(
        #     url=self.url,
        #     headers=self.api_headers,
        #     method='POST',
        #     body=index_json,
        #     callback=self.parse,
        #     dont_filter=True)

        yield scrapy.FormRequest(
            url=self.url,
            headers=self.api_headers,
            formdata=eval(index_json),
            callback=self.parse,
            dont_filter=True)

    def parse(self, response):
        print('程序进入')
        res_json = json.dumps(response.text)
        print(res_json)

scrapy代码如下：

import scrapy
import json
import requests


class BxwSpiderSpider(scrapy.Spider):
    name = 'bxw_spider'

    api_headers = {
        'Host': 'mpapi.baixing.com',
        'Connection': 'keep-alive',
        'Content-Length': '24',
        'BAIXING-SESSION': '$2y$10$iYbdcOD0tqZQWK1ITZc6PuIMfVDUsxItUQwepiF1VyC00ti24fPcG',
        'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.143 Safari/537.36 MicroMessenger/7.0.9.501 NetType/WIFI MiniProgramEnv/Windows WindowsWechat',
        'content-type': 'application/json',
        'env_version': '7.0.9',
        'model': 'microsoft',
        'network_type': 'wifi',
        'os': 'Windows',
        'os_version': '10',
        'source': '70',
        'source_params': '',
        'source_path': '',
        'template_version': 'Ver1.3.6',
        'track_id': '1607997570581-6558221-0b293e26ae2048-15816961',
        'udid': 'a382863f-92eb-45aa-a2b0-bca844ca6dd9',
        'Referer': 'https://servicewechat.com/wxd9808e2433a403ab/42/page-frame.html',
        'Accept-Encoding': 'gzip, deflate, br',
    }

    url = 'https://mpapi.baixing.com/v1.3.6/'  # API接口

    def start_requests(self):
        index_json = '{"listing.getAds": {"areaId": "m28", "categoryId": "gongzuo", "page": 1}}'  # 2 3

        # yield scrapy.Request(
        #     url=self.url,
        #     headers=self.api_headers,
        #     method='POST',
        #     body=index_json,
        #     callback=self.parse,
        #     dont_filter=True)

        yield scrapy.FormRequest(
            url=self.url,
            headers=self.api_headers,
            formdata=eval(index_json),
            callback=self.parse,
            dont_filter=True)

    def parse(self, response):
        print('程序进入')
        res_json = json.dumps(response.text)
        print(res_json)

之前爬另外一个网站，也是POST种携带请求参数，request版本就能成功，scrapy就是不行，是我使用姿势不对？

非常疑惑，百度过很多了！！！

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

11条回答默认最新

放风喽 2020-12-16 13:32

关注

兄弟，半个小时的辛苦

class CeshiSpider(scrapy.Spider):
    name = 'ceshi'
    api_headers = {
        'Host': 'mpapi.baixing.com',
        'BAIXING-SESSION': '$2y$10$iYbdcOD0tqZQWK1ITZc6PuIMfVDUsxItUQwepiF1VyC00ti24fPcG',
        'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.143 Safari/537.36 MicroMessenger/7.0.9.501 NetType/WIFI MiniProgramEnv/Windows WindowsWechat',
        # 'content-type': 'application/json',
        # 'Content-Length': '24',
        'Referer': 'https://servicewechat.com/wxd9808e2433a403ab/42/page-frame.html',
    }

    url = 'https://mpapi.baixing.com/v1.3.6/'  # API接口
    def start_requests(self):
        index_json = {"listing.getAds": {"areaId": "m28", "categoryId": "gongzuo", "page": 1}}  # 2 3

        yield scrapy.Request(
            url=self.url,
            method="POST",
            headers=self.api_headers,
            body=json.dumps(index_json),
            callback=self.parse,
            dont_filter=True)

    def parse(self, response):
        print("下面是结果")
        print(response.text)

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(10条)

报告相同问题？

关注问题

scrapy中请求携带json与request有什么区别？【赏】 python
2020-12-15 11:12

回答 4 已采纳兄弟，半个小时的辛苦 class CeshiSpider(scrapy.Spider): name = 'ceshi' api_headers = { 'Host'
关于#pythonscrapy#的问题，如何解决？ python 开发语言爬虫
2023-04-02 16:26

回答 2 已采纳好问题！！抱歉我也不太懂，你问问chatGPT吧：https://new.quke123.com/ 或者其他Python群友：https://app.yinxiang.com
Python中scrapy.FormRequest老是返回400错误响应 python
2022-09-17 21:20

回答 2 已采纳你可以参考下这篇文章：scrapy框架中的Request()、FormRequest()、FormRequest.from_response()的小结
Scrapy JSON请求
2020-03-26 16:33

Chen.Junbao的博客以下步骤建议在写python代码前用 scrapy shell 进行尝试。 Request 请求首先对目标网站进行请求： scrapy shell <url> 之后使用xpath语法进行标签内容提取： In [1]: response.xpath(<xpath_info>) Out...
爬虫scrapy框架爬不出来，但是request可以出来 http python 爬虫
2022-05-06 00:26

回答 2 已采纳你应该继承 scrapy.SpiderCrawlSpider 不要自定义 parse 函数。
scrapy中start_requests指定回调函数为何没有调用 python 有问必答爬虫
2022-01-20 23:02

回答 2 已采纳改成这样试试 yield scrapy.Request(url=login_url, headers=header, body=json.dumps(param), method='
请问Python爬虫如何把爬取数据存入csv文件中 python 开发语言有问必答爬虫
2021-11-21 21:19

回答 1 已采纳你用open打开csv文件，然后以字符串格式写入就行了，每个数据之间用英文逗号隔开即可
scrapy中Request请求使用Request payload参数 json或text
2018-10-24 10:06

Voccoo的博客如下图所示，在这个请求中，payload中有个参数在F12中有个‘str’=null的参数，在大家需要写的时候，如果真的在dict中也这么写，很容易会出现问题的。要不返回400，要不没有数据。那么在这里详细的说下在scrapy中...
用python requests.post（）实现翻页，表单上传后返回数据缺失 python 有问必答
2021-11-27 19:50

回答 1 已采纳 1.需要传cookies参数,2.data数据的即字典的值都要写成字符串。获取json后再从中用bs4解析出数据。参考如下代码： import requests cookies = { 'P
python抓取405错误 python 有问必答爬虫
2022-01-07 16:37

回答 2 已采纳建议使用requests,添加参数headers,cookies，params,这样试一下。
爬Ajax地址的结果与network代码不同，缺失一部分变成null怎么解决？ ajax python 有问必答爬虫
2022-03-27 19:53

回答 2 已采纳没问题啊？ import requests import time headers = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win
Scrapy发送POST请求携带Request Payload参数
2021-09-18 12:07

lemuzhi_零度的博客报错3：说无法解压缩，不可编辑的int对象，这是啥，莫非是我传的参数有问题？反复检查，怀疑人生中...... 报错4：返回405，并且是一个GET请求，？？？，FormRequest不是POST请求吗，怎么变成了GET请求？又是一顿...
如何使用这个python程序 python 爬虫
2022-10-24 06:54

回答 4 已采纳希望可以帮上你,对你有启发 from selenium import webdriver from lxml import etree import numpy as np def arr_si
Python的requests.post 的data和json参数到底有什么区别？
2023-02-10 14:55

齐天小胜的博客代码很简单，但是服务器一直提示错误，客户端收不到结果然后加上header参数，再次进行调试经过反复调试，把代码改成下面的方法就可以了回头想想，问题的根本解决是把requests.post 的参数 “data”改成了“json”。
scrapy.Request（）post方式发送json数据
2021-12-17 10:19

始識的博客再scrapy 中可以使用formdata 发送post请求但是也仅限于formdata 方式的数据但是如果post请求要求传递json 单纯使用下列方式是提取不出来出数据的 def start_requests(self): for i in range(1000): ...
没有解决我的问题, 去提问

悬赏问题

¥15 腾讯云如何建立同一个项目中物模型之间的联系
¥30 VMware 云桌面水印如何添加
¥15 用ns3仿真出5G核心网网元
¥15 matlab答疑关于海上风电的爬坡事件检测
¥88 python部署量化回测异常问题
¥30 酬劳2w元求合作写文章
¥15 在现有系统基础上增加功能
¥15 远程桌面文档内容复制粘贴，格式会变化
¥15 这种微信登录授权谁可以做啊
¥15 请问我该如何添加自己的数据去运行蚁群算法代码

码龄粉丝数原力等级 --

scrapy中请求携带json与request有什么区别？【赏】

11条回答默认最新

码龄粉丝数原力等级 --

悬赏问题

scrapy中请求携带json与request有什么区别？【赏】

11条回答 默认 最新

悬赏问题

11条回答默认最新