Scrapy框架（爬虫中间件）：TypeError: init() missing 5 required positional arguments

问题遇到的现象和发生背景

        使用Scrapy抓取数据写入MySql数据库，抛出异常TypeError: __init__() missing 5 required positional arguments

问题相关代码，请勿粘贴截图

代码片段：

# 爬虫模块代码
from scrapy import Spider,Request
from urllib.parse import urlencode
import json
from ItemPipeline.items import ImageItem

class ImageSpider(Spider):
    name = 'images'
    start_urls = ['https://images.so.com']
    def start_requests(self):
        # 定义Restful API
        data = {'ch':'beauty','listtype':'new'}
        # 定义Restful API的参数
        base_url = 'https://image.so.com/zj?'
        # 通过for-in循环想服务端请求MAX_PAGE参数指定的次数
        for page in range(1,self.settings.get('MAX_PAGE')+1):
            # 产生每次提交的sn参数的值
            data['sn'] = page * 30
            # 将data编码成URL参数（主要转换某些无法放在URL中的特殊字符，如空格）
            params = urlencode(data)
            # 组成完整的URL
            url = base_url + params
            # 通过yield实现一个产生器，只有读取，才会返回当前的Request
            yield Request(url,self.parse)

    # 分析HTTP响应信息（Response）
    def parse(self, response, **kwargs):
        # 将HTTP响应信息抓好为JSON对象
        result = json.loads(response.text)
        # 得到list属性中的每一个元素
        for image in result.get('list'):
            item = ImageItem()
            item['id'] = image.get('imageid')
            item['url'] = image.get('qhimg_url')
            item['title'] = image.get('group_title')
            item['thumb'] = image.get('qhimg_thumb_url')
            yield item

# 管道中间件的代码
from itemadapter import ItemAdapter

class ItempipelinePipeline:
    def process_item(self, item, spider):
        return item

import pymongo
import pymysql
from scrapy import Request
from scrapy.exceptions import DropItem
from scrapy.pipelines.images import ImagesPipeline

class MysqlPipeline():
    def __init__(self, host, database, user, password, port):
        self.host = host
        self.database = database
        self.user = user
        self.password = password
        self.port = port

    @classmethod
    def from_crawl(cls,crawler):

        # 创建MysqlPipeline类的实例
        return cls(
            host=crawler.settings.get('MYSQL_HOST'),
            database=crawler.settings.get('MYSQL_DATABASE'),
            user=crawler.settings.get('MYSQL_USER'),
            password=crawler.settings.get('MYSQL_PASSWORD'),
            port=crawler.settings.get('MYSQL_PORT'),
        )

    def open_spider(self,spider):
        # 连接数据库
        self.db = pymysql.connect(host=self.host,user=self.user,password=self.password,database=self.database,
                                  charset='utf8',port=self.port)
        self.cursor = self.db.cursor()

    def close_spider(self,spider):
        # 关闭数据库
        self.db.close()

    def process_item(self,item,spider):
        print(item['title'])
        data = dict(item)
        keys = ', '.join(data.keys())
        values = ', '.join(['%s'] * len(data))
        sql = 'insert into %s (%s) values (%s)' % (item.table, keys, values)
        # 将与图片相关的数据插入MySQL数据库的images表中
        self.cursor.execute(sql,tuple(data.values()))
        self.db.commit()
        return item

# 将图片保存到本地
class ImagePipeline(ImagesPipeline):
    # 返回对应本地图像文件的文件名
    def file_path(self, request, response=None, info=None):
        url = request.url
        file_name = url.split('/')[-1]
        return file_name
    # 过滤不符合条件的图片,单个Item对象完成下载后调用该方法
    def item_completed(self, results, item, info):
        image_paths = [x['path'] for ok,x in results if ok]
        if not image_paths:
            # 抛出异常，剔除当前下载的图片
            raise DropItem('Image Downloaded Failed')
        return item
    # 根据当前URL创建Request对象，并返回该对象，Request对象会加到调度队列中猪呢比下载该图像
    def get_media_requests(self, item, info):
        yield Request(item['url'])

运行结果及报错内容

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
川野先生 2022-02-11 11:41
关注
在init函数内部引入settings然后依次赋值就解决了

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

Scrapy框架（爬虫中间件）：TypeError: __init__() missing 5 required positional arguments python 中间件爬虫
2022-01-29 11:40

回答 2 已采纳在init函数内部引入settings然后依次赋值就解决了
利用Scrapy框架爬虫时出现报错ModuleNotFoundError: No module named 'scrapytest.NewsItems'？ python
2019-11-15 23:52

回答 2 已采纳 import scrapy #引入容器 from scrapytest.NewsItems import NewsItem 改为 from scrapytest.items import Ne
python运行scrapy框架出现报错 NameError: name 'imp' is not defined python
2022-04-28 23:20

回答 7 已采纳如果你不记得改了什么的话，重装吧。毕竟你改了啥，怎么改回去就只有神才知道了。环境里面的.py文件改了的话基本没什么方法，除了重装。按报错来看，playwright, pyee,twisted,win3
已解决TypeError: __init__() missing 1 required positional argument: ‘scheme‘
2022-09-13 14:11

袁袁袁袁满的博客已解决（python连接elasticsearch报错）TypeError: init() missing 1 required positional argument: ‘scheme’
在 python scrapy爬虫框架：response.xpath（）的返回值是[ ],这个怎么解决？ python
2020-07-03 11:16

回答 4 已采纳考虑网页的内容使用了ajax，使用右键-》查看网页源代码，看是否仍然能获得指定的内容
scrapy爬虫出现 DEBUG: Crawled (404) python
2019-04-17 16:25

回答 1 已采纳如果楼主是用scrapy框架爬的话，可以在settings.py加上User-Agent信息，这样应该就可以了
爬虫scrapy框架爬不出来，但是request可以出来 http python 爬虫
2022-05-06 00:26

回答 2 已采纳你应该继承 scrapy.SpiderCrawlSpider 不要自定义 parse 函数。
twisted builtins.TypeError: __init__() missing 1 required positional argument: 'dbpool'
2020-05-10 14:52

锅前带刀小笼包的博客学习爬虫异步插入，遇到问题 ...builtins.TypeError: __init__() missing 1 required positional argument: 'dbpool' 发现是函数名写错，应该是from_settings ，结果写成了from_setting，低级错误，记录一下 pip
Scrapy的下载中间件返回响应对象时，为什么不会执行 del 操作？ python selenium 有问必答
2021-04-22 17:43

回答 4 已采纳已经解决，创建中间件时请使用 `spider_closed`方法并连接到信号： --skip-- @classmethod def from_crawler(cls, crawler):
scrapy如何传入start_requests python 爬虫
2021-12-28 15:45

回答 1 已采纳获取到翻页的url之后调用start_request不就传了，求采纳，谢谢🙈🙈🙈
scrapy中start_requests指定回调函数为何没有调用 python 有问必答爬虫
2022-01-20 23:02

回答 2 已采纳改成这样试试 yield scrapy.Request(url=login_url, headers=header, body=json.dumps(param), method='
TypeError: close_spider() takes 1 positional argument but 2 were given报错解决
2022-11-29 14:51

阿龙的代码在报错的博客 TypeError: close_spider() takes 1 positional argument but 2 were given报错解决
scrapy通用爬虫parse解析中的问题 python 爬虫
2022-10-16 01:14

回答 1 已采纳检查一下parse item 函数的response是否是正常的
这可能是 Python 面向对象编程的最佳实践
2020-03-04 11:57

华为云开发者联盟的博客如果你用过 Scrapy、Django 等框架，你会发现 Scrapy 里面有一个 Item 的定义，只需要定义一些 Field 就可以了，Django 里面的 Model 也类似这样，只需要定义其中的几个字段属性就可以完成整个类的定义了，非常方便...
scrapy-redis报错：spop() takes 2 positional arguments but 3 were given
2023-04-16 18:17

黄昏中起飞的猫头鹰的博客 Scrapy-Redis是一个基于Scrapy的爬虫框架，它允许我们创建分布式爬虫，这样我们可以在多台机器上运行爬虫以提高效率。然而，在使用过程中，我们有时会遇到一些报错，就像我们今天要讨论的这个问题一样。要解决这个...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 2月19日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 2月11日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月29日

悬赏问题

¥15 素材场景中光线烘焙后灯光失效
¥15 请教一下各位，为什么我这个没有实现模拟点击
¥15 执行 virtuoso 命令后，界面没有，cadence 启动不起来
¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
¥20 有关区间dp的问题求解
¥15 多电路系统共用电源的串扰问题
¥15 slam rangenet++配置
¥15 有没有研究水声通信方面的帮我改俩matlab代码
¥15 ubuntu子系统密码忘记
¥15 保护模式-系统加载-段寄存器

Scrapy框架（爬虫中间件）：TypeError: __init__() missing 5 required positional arguments

问题遇到的现象和发生背景

问题相关代码，请勿粘贴截图

运行结果及报错内容

2条回答 默认 最新

问题事件

悬赏问题

Scrapy框架（爬虫中间件）：TypeError: init() missing 5 required positional arguments

2条回答默认最新