a'ゞ筱辰 2021-12-28 07:45 采纳率: 100%
浏览 60
已结题

scrapy如何传入start_requests

现在采用分类+翻页爬取 运行出错 如何把翻页的url传给start_requests

class FyxzSpider(scrapy.Spider):
    name = 'fyxz'
    allowed_domains = ['fyxz.com']
    # start_urls = ['http://fyxz.com/']
    start_urls = 'http://fyxz.com/sort/%s?page1'

    custom_settings = {
        'CONCURRENT_REQUESTS': 2,
        'DOWNLOAD_DELAY': 1,
    }

    categories = {
        'yingyinbofang': '影音播放', 'xitonggongju': '系统工具', 'tongxunshejiao': '通讯社交', 'shoujimeihua': '手机美化',
        'xinwenyuedu': '新闻阅读', 'sheyingtuxiang': '摄影图像', 'kaoshixuexi': '考试学习', 'wangshanggouwu': '网上购物',
        'jinronglicai': '金融理财', 'shenghuoxiuxian': '生活休闲', 'lvyouchuxing': '旅游出行', 'jiankangyundong': '健康运动',
        'bangongshangwu': '办公商务', 'yuerqinzi': '育儿亲子',
        'xiuxianyizhi': '休闲益智', 'juesebanyan': '角色扮演', 'dongzuomaoxian': '动作冒险', 'wangluoyouxi': '网络游戏',
        'feixingsheji': '飞行射击', 'jingyingcelue': '经营策略', 'paokujingsu': '跑酷竞速', 'tiyujingji': '体育竞技',
        'pukeqipai': '扑克棋牌', 'fuzhugongju': '辅助工具',
    }

    def start_requests(self):
        pass


    def parse_category(self):
        for key in self.categories.keys():
            yield scrapy.Request(self.start_urls % key, callback=self.parse_page)


    def parse_page(self, response):
        lis = response.xpath('//div[@class="sort-content"]/ul/li/a/@href')
        for li in lis:
            yield scrapy.Request(li, callback=self.parse_item)




    def parse_item(self, response, **kwargs):
        loader = ItemLoader(item=AppItem(), response=response)
        loader.add_xpath('name', '//div[@class="app-down-box down-panel flex"]/div[@class="info"]/h1/text()')
        yield loader.load_item()

展开全部

  • 写回答

1条回答 默认 最新

  • 爱音斯坦牛 全栈领域优质创作者 2021-12-28 08:16
    关注

    获取到翻页的url之后调用start_request不就传了,求采纳,谢谢🙈🙈🙈

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
    a'ゞ筱辰 2021-12-28 08:21

    具体怎么写呢

    回复
编辑
预览

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 12月29日
  • 已采纳回答 12月28日
  • 创建了问题 12月28日
手机看
程序员都在用的中文IT技术交流社区

程序员都在用的中文IT技术交流社区

专业的中文 IT 技术社区,与千万技术人共成长

专业的中文 IT 技术社区,与千万技术人共成长

关注【CSDN】视频号,行业资讯、技术分享精彩不断,直播好礼送不停!

关注【CSDN】视频号,行业资讯、技术分享精彩不断,直播好礼送不停!

客服 返回
顶部