五秒速的刀 2021-04-07 14:22 采纳率: 100%
浏览 43
已结题

python,scrapy,爬取不规则

import scrapy
from spider1.items import Spider1Item

class JobSpider(scrapy.Spider):
    name = 'job'
    allowed_domains = ['qidian.com']

    def start_requests(self):
        for next_page in range(1,6):
            url = 'https://www.qidian.com/finish?action=hidden&orderId=&style=1&pageSize=20&siteid=1&pubflag=0&hiddenField=2&page={0}'.format(
                next_page)
            yield scrapy.Request(url=url, callback=self.parse)

    def parse(self, response, **kwargs):
        items = response.xpath('//div[@class="book-img-text"]/ul/li')
        for item in items:
            a = Spider1Item()
            a['title'] = item.xpath('.//div[@class="book-mid-info"]/h4/a/text()').extract()[0]
            a['author'] = item.xpath('.//div[@class="book-mid-info"]/p[@class="author"]/a/text()').extract()[0]
            yield a

 

这串代码爬取不按照顺序爬取,有什么办法可以让他按顺序爬取。

  • 写回答

4条回答 默认 最新

  • 关注

    应该是后台返回的数据就是这个顺序吧。

    评论

报告相同问题?

悬赏问题

  • ¥30 基于信创PC发布的QT应用如何跨用户启动后输入中文
  • ¥20 非root手机,如何精准控制手机流量消耗的大小,如20M
  • ¥15 远程安装一下vasp
  • ¥15 自己做的代码上传图片时,报错
  • ¥15 Lingo线性规划模型怎么搭建
  • ¥15 关于#python#的问题,请各位专家解答!区间型正向化
  • ¥15 unity从3D升级到urp管线,打包ab包后,材质全部变紫色
  • ¥50 comsol温度场仿真无法模拟微米级激光光斑
  • ¥15 上传图片时提交的存储类型
  • ¥15 VB.NET如何绘制倾斜的椭圆