python,scrapy,爬取不规则

import scrapy
from spider1.items import Spider1Item

class JobSpider(scrapy.Spider):
    name = 'job'
    allowed_domains = ['qidian.com']

    def start_requests(self):
        for next_page in range(1,6):
            url = 'https://www.qidian.com/finish?action=hidden&orderId=&style=1&pageSize=20&siteid=1&pubflag=0&hiddenField=2&page={0}'.format(
                next_page)
            yield scrapy.Request(url=url, callback=self.parse)

    def parse(self, response, **kwargs):
        items = response.xpath('//div[@class="book-img-text"]/ul/li')
        for item in items:
            a = Spider1Item()
            a['title'] = item.xpath('.//div[@class="book-mid-info"]/h4/a/text()').extract()[0]
            a['author'] = item.xpath('.//div[@class="book-mid-info"]/p[@class="author"]/a/text()').extract()[0]
            yield a

这串代码爬取不按照顺序爬取，有什么办法可以让他按顺序爬取。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-赖老师（软件之家） 2021-04-07 14:24
关注
应该是后台返回的数据就是这个顺序吧。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

scrapy爬取图片，爬取不到 python 有问必答
2021-05-23 20:32

回答 2 已采纳你已经爬到图片连接了，这个看到的管道文件的代码怎样写，要对图片链接发送请求访问，然后保存才行
python scrapy爬虫如果想要下一页但是没有href python 爬虫
2022-12-14 00:18

回答 1 已采纳你要模拟参数，具体代码如下： import http.client conn = http.client.HTTPSConnection("chl.cn") #page 5 #submit 下一页
用scrapy爬取站长素材无法下载图片 python 爬虫
2021-08-03 18:51

回答 2 已采纳找到原因了，是要在setting中加上MEDIA_ALLOW_REDIRECTS = True，貌似是中间件的内容，我还没学到，所以不清楚什么意思，有大佬可以解释一下吗看所有日志后会发现其实有地方报错
python scrapy 爬取csdn论坛列表以及子页面
2018-08-24 09:45

同时，尊重网站的robots.txt规则，合法合规地进行网络爬取，是每一个爬虫开发者应有的责任。总结来说，本项目涉及了Python Scrapy框架的使用，包括创建Spider、定义请求与解析、使用Pipeline处理数据以及应对可能...
scrapy 爬取图片报错 error processing python
2021-12-20 01:08

回答 1 已采纳 http: 去那里啦?
如何利用scrapy爬取带标签的网页内容并保存到自己的服务器上？ mysql python sql
2018-02-09 09:34

回答 3 已采纳 1. 把整个爬取到的网页内容直接存储到数据库肯定是可以的，你之所以没有成功，应该是因为你的数据库中的相应字段错了，整个网页内容都比较长，一般都是要用text字段，甚至是LongText)（最大长度42
scrapy 爬取商品视频url,详情失败 python
2022-02-17 10:28

回答 3 已采纳 js加载的，先打印看下获取的整个网页。我试了下，在下图这个位置可以找到视频链接，可以用正则或者别的方法取出来
scrapy爬取百度图片时Forbid spider access python 有问必答
2021-06-13 23:12

回答 2 已采纳这个是百度反爬虫导致的，
scrapy 爬取图片时图片的url总是显示None python 有问必答
2021-12-04 01:41

回答 1 已采纳 img_url = div.xpath('./div/a/img/src').extract_first() src前面少了 @ 改成 img_url = div.xpath('./
python爬虫scrapy python 有问必答
2021-07-22 10:03

回答 2 已采纳看下数据是否是动态加载的，多抓几次包，分析下；可能需要通过添加page参数，进行爬取！
python scrapy 爬取包含iframe标签内的数据
2019-05-25 11:50

WBerica的博客如图所示：所要提取的数据都在iframe标签里面的，直接用xpath提取iframe标签里的内容是提取不到的，看到图一有一个script 所有的数据都在这个js标签内的,展开script标签后会看到一堆js代码，一直往下找会发现一个...
使用python scrapy框架写爬虫如何爬取搜狐新闻的参与人数？ python 爬虫
2016-03-29 10:07

回答 2 已采纳这个是可能异步ajax返回的，所以需要用selenium等webdriver来处理
python scrapy爬取网站数据二（scrapy使用详细介绍）
2018-06-30 11:52

风水月的博客上篇文章 python scrapy爬取网站数据一从一个简单的例子中给大家呈现了scrapy的使用，本篇将对scrapy的常用写法做一个简单的介绍。 1、scrapy工程创建在命令行输入如下命令，创建一个使用scrapy框架的工程 ...
scrapy 爬取酷狗T500音乐
2019-04-25 10:05

在本项目中，我们利用Scrapy来爬取酷狗T500音乐平台上的音乐信息，这包括但不限于歌曲名称、歌手、专辑、歌词以及链接等。这些数据对于音乐爱好者或者数据分析者来说具有很高的价值。首先，我们需要创建一个Scrapy...
没有解决我的问题, 去提问

悬赏问题

¥30 基于信创PC发布的QT应用如何跨用户启动后输入中文
¥20 非root手机，如何精准控制手机流量消耗的大小，如20M
¥15 远程安装一下vasp
¥15 自己做的代码上传图片时，报错
¥15 Lingo线性规划模型怎么搭建
¥15 关于#python#的问题，请各位专家解答！区间型正向化
¥15 unity从3D升级到urp管线，打包ab包后，材质全部变紫色
¥50 comsol温度场仿真无法模拟微米级激光光斑
¥15 上传图片时提交的存储类型
¥15 VB.NET如何绘制倾斜的椭圆

python,scrapy,爬取不规则

4条回答 默认 最新

悬赏问题

4条回答默认最新