scrapy通用爬虫parse解析中的问题

使用scrapy配置通用爬虫的时候怎么parse_item()函数里的数据没用解析出来为什么

这是代码

import scrapy
from scrapy.linkextractors import LinkExtractor
from scrapy.spiders import CrawlSpider, Rule
from scrapyuniversal.utils import get_config
from scrapyuniversal.rules import rules
from scrapyuniversal import urls

class UniversalSpider(CrawlSpider):

name = 'universal'

def __init__(self, name, *args, **kwargs):
    super().__init__(*args, **kwargs)
    config = get_config(name)
    self.config = config
    self.rules = rules.get(config.get('rules'))
    start_urls = config.get('start_urls')
    print(start_urls)
    if start_urls:
        if start_urls.get('type') == 'static':
            self.start_urls = start_urls.get('value')
        elif start_urls.get('type') == 'dynamic':
            self.start_urls = list(eval('urls.' + start_urls.get('method'))(*start_urls.get('args', [])))
    self.allowed_domains = config.get('allowed_domains')
    # super(UniversalSpider, self).__init__(*args, **kwargs)

def parse_item(self, response):
    item = self.config.get('item')
    if item:
        cls = eval(item.get('class'))()
        loader = eval(item.get('loader'))(cls, response=response)
        # 动态获取属性配置
        for key, value in item.get('attrs').items():
            for extractor in value:
                if extractor.get('method') == 'xpath':
                    loader.add_xpath(key, *extractor.get('args'), **{'re': extractor.get('re')})
                if extractor.get('method') == 'css':
                    loader.add_css(key, *extractor.get('args'), **{'re': extractor.get('re')})
                if extractor.get('method') == 'value':
                    loader.add_value(key, *extractor.get('args'), **{'re': extractor.get('re')})
                if extractor.get('method') == 'attr':
                    loader.add_value(key, getattr(response, *extractor.get('args')))
        yield loader.load_item()

这是运行结果截图

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
honestman_ 2022-10-16 09:54
关注
检查一下parse item 函数的response是否是正常的

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Scrapy框架的使用之Scrapy通用爬虫_为什么scrapy的parse_start_url和parse
2024-04-27 20:04

2301_79099373的博客要实现新闻的爬取，我们需要做的就是定义好Rule，然后实现解析函数。下面我们就来一步步实现这个过程。首先将start_urls修改为起始链接，代码如下所示：之后，Spider爬取start_urls里面的每一个链接。所以这里第一个...
基于 scrapy-redis 的通用分布式爬虫框架.zip
2024-04-08 22:23

Scrapy-Redis 是一个强大的 Python 爬虫框架，它结合了 Scrapy 和 Redis 这两个优秀的工具，为实现分布式爬虫提供了便利。本项目源码及说明适用于毕业设计，已经在 Windows 10/11 环境下经过验证，能够正常运行，...
如何使用Scrapy库来构建爬虫_利用scrapy库
2024-05-01 17:42

2401_84140569的博客我们在看视频学习的时候，不能光动眼动脑不动手，比较科学的学习方法是在理解之后运用它们，这时候练手项目就很适合了，只是里面的...基本上主流的和经典的都有，这里我就不放图了，版权问题，个人看看是没有问题的。
Python爬虫—scrapy框架
2022-08-31 15:41

白天数糖晚上数羊的博客 Python爬虫—scrapy框架
基于Scrapy的爬虫解决方案
2021-01-21 19:40

腾讯云开发者的博客导语 |Scrapy是一个较为流行的Python爬虫框架，本文将简单介绍Scrapy的使用方法，并对一些常见问题提出解决方法。对于想快速上手爬虫的初学者来说，本文值得一阅。文章作者：赵...
基于scrapy的知道*乎爬虫及可视化分析
2022-12-25 18:21

计算机软件设计的博客基于scrapy的知道*乎爬虫及可视化分析
Python爬虫 | 如何使用爬虫框架scrapy爬取分页数据案例演示
2023-10-06 11:00

白帽黑客艾登的博客并爬取第1~5页数据中第2条。
Scrapy框架实战（五）：通用爬虫 CrawlSpider
2020-12-23 22:53

棒棒编程修炼场的博客目录1. CrawlSpider2. Item Loader3. 基本使用 ...例如，像 Google、百度这样的搜索引擎就是使用这种通用爬虫抓取了整个互联网的数据，然后经过复杂的处理，最终将处理过的数据保存到分布式数据库中，通过搜
python scrapy框架爬虫_Python Scrapy爬虫框架学习
2020-11-21 03:28

weixin_39653320的博客 Scrapy 是用Python实现一个为爬取网站数据、提取结构性数据而编写的应用框架。一、Scrapy框架简介Scrapy是一个为了爬取网站数据，提取结构性数据而编写的应用框架。可以应用在包括数据挖掘，信息处理或存储历史数据...
Python爬虫入门：详解Scrapy爬虫框架的基本使用（附零基础学习资料）
2022-10-27 08:15

大模型扬叔的博客 Python爬虫入门：详解Scrapy爬虫框架的基本使用（附零基础学习资料）
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 11月9日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 11月1日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月16日

scrapy通用爬虫parse解析中的问题

1条回答 默认 最新

问题事件

1条回答默认最新