【帮帮孩子】scrapy框架请问如何在parse函数中调用已有的参数来构造post请求获得回传的数据包呀

刚接触scrapy框架一周的菜鸟，之前都没用过框架手撸爬虫的，这次遇到了一个问题，我先请求一个网页

    def start_requests(self):
        urls=["http://www.tiku.cn/index/index/questions?cid=14&cno=1&unitid=800417&chapterid=701354&typeid=600122&thrknowid=700137"]
        for url in urls:
            yield scrapy.Request(url=url,callback=self.parse)

然后传给parse方法获得了question_ID这个关键参数,然后我想在这里面直接利用这个question_id这个参数构造post请求获得它回传的json数据包并保存在
item['正确答案']之中，请问我要如何实现？，谢谢大佬百忙之中抽空回答我的疑问，谢谢！

    def parse(self, response):
        item = TikuItem ()
                for i in range(1,11):
                    QUESTION_ID=str(response.xpath('(/html/body/div[4]/div[2]/div[2]/div['+str(i)+']/div[@class="q-analysis text-l"]/@id)').extract_first()[3:])
            item['question_ID']=QUESTION_ID

这是我的items.py文件

class TikuItem(scrapy.Item):
    # define the fields for your item here like:
    # name = scrapy.Field()
        question_ID=scrapy.Field()#题号
        correct_answer=scrapy.Field()#正确答案

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
放风喽 2019-11-18 10:06
关注
yield scrapy.FormRequest(url=url,callback=处理函数,formdata=formdata)

post的数据存放在formdata里面

随便百度一下就能搞定，

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

scrapy中start_requests指定回调函数为何没有调用 python 有问必答爬虫
2022-01-20 23:02

回答 2 已采纳改成这样试试 yield scrapy.Request(url=login_url, headers=header, body=json.dumps(param), method='
在scrapy中能不能进行多次post请求？ python
2020-12-13 19:29

回答 1 已采纳通过scrapy 可以多次发送 post 请求的，在start_requests方法中通过 yield 去调用另一个方法即可
scrapy框架能不能阻塞某一个请求，等其他的请求全部结束在执行这个请求呢 python 爬虫
2021-08-25 09:27

回答 3 已采纳不会啊，传参+回调函数，不会导致数据流错乱的。回调函数只是处理上一层调用回调函数的时传入的参数/url
【python|scrapy】yield scrapy.Request在自定义函数中调用没有执行
2022-09-14 22:16

胡侃有料的博客 yield scrapy.Ruequest自定义函数中调用不被执行
scrapy通用爬虫parse解析中的问题 python 爬虫
2022-10-16 01:14

回答 1 已采纳检查一下parse item 函数的response是否是正常的
python3 scrapy Request 请求时怎么保持headers 的参数首字母不大写 python 数据挖掘
2019-05-15 16:44

回答 1 已采纳在spider文件中spider类的上面写下不希望首字母大写的header ``` from twisted.web.http_headers import Headers as TwistedH
跪求，scrapy中为什么def parse(self, response)无响应，求大神 python
2021-01-30 21:50

回答 5 已采纳把跟scrapy一起的库删除重新下载就好了
【Python爬虫必备—＞Scrapy框架快速入门篇——上】
2021-08-09 11:30

孤寒者的博客【Python爬虫必备—＞Scrapy框架快速入门篇——上】
在 python scrapy爬虫框架：response.xpath（）的返回值是[ ],这个怎么解决？ python
2020-07-03 11:16

回答 4 已采纳考虑网页的内容使用了ajax，使用右键-》查看网页源代码，看是否仍然能获得指定的内容
python运行scrapy框架出现报错 NameError: name 'imp' is not defined python
2022-04-28 23:20

回答 7 已采纳如果你不记得改了什么的话，重装吧。毕竟你改了啥，怎么改回去就只有神才知道了。环境里面的.py文件改了的话基本没什么方法，除了重装。按报错来看，playwright, pyee,twisted,win3
scrapy中请求携带json与request有什么区别？【赏】 python
2020-12-15 11:12

回答 4 已采纳兄弟，半个小时的辛苦 class CeshiSpider(scrapy.Spider): name = 'ceshi' api_headers = { 'Host'
精通Python爬虫框架Scrapy.pdf
2020-12-20 13:57

精通Python爬虫框架Scrapy.pdf
scrapy框架中多爬虫文件情况下怎么设置那个爬虫走那个管道类呢？ python redis 爬虫
2021-09-02 17:19

回答 2 已采纳方法一：在pipeline里添加管道类，在close_spider方法里根据 spider.name 进行判断，进行对应处理最后在settings中开启管道。方法二：scrapy用system命令在
python爬虫框架scrapy实战之爬取京东商城进阶篇
2021-01-20 04:15

之前的一篇文章已经讲过怎样获取链接，怎样获得参数了，详情请看python爬取京东商城普通篇，本文将详细介绍利用python爬虫框架scrapy如何爬取京东商城，下面话不多说了，来看看详细的介绍吧。代码详解 1、首先...
Python中Scrapy框架
2022-04-15 13:57

SteveKenny的博客文章目录Scrapy 框架一、简介1、介绍2、环境配置3、常用命令4、运行原理4.1 流程图4.2 部件简介4.3 运行流程二、创建项目1、修改配置2、创建一个项目3、定义数据4、编写并提取数据5、存储数据6、运行...
没有解决我的问题, 去提问

悬赏问题

¥50 如何用脚本实现输入法的热键设置
¥20 我想使用一些网络协议或者部分协议也行，主要想实现类似于traceroute的一定步长内的路由拓扑功能
¥30 深度学习，前后端连接
¥15 孟德尔随机化结果不一致
¥15 apm2.8飞控罗盘bad health，加速度计校准失败
¥15 求解O-S方程的特征值问题给出边界层布拉休斯平行流的中性曲线
¥15 谁有desed数据集呀
¥20 手写数字识别运行c仿真时，程序报错错误代码sim211-100
¥15 关于#hadoop#的问题
¥15 (标签-Python|关键词-socket)

【帮帮孩子】scrapy框架请问如何在parse函数中调用已有的参数来构造post请求获得回传的数据包呀

1条回答 默认 最新

悬赏问题

1条回答默认最新