scrapy无法将数据写入mysql数据库

scrapy无法将数据写入mysql数据库，不用scrapy直接写爬虫可以存到mysql

问题相关代码

pipeline部分


#同步写入
import pymysql


class Index120Pipeline(object):
    def __init__(self):
        # connection database
        self.connect = pymysql.connect(host='127.0.0.1', user='root', passwd='root', db='index_120', charset='utf8', use_unicode=False)
        # get cursor
        self.cursor = self.connect.cursor()
        #数据库能连接成功
        print("连接数据库成功")

    def process_item(self, item, spider):
        # sql语句
        insert_sql = """
        insert into news(id, contain, title, time) VALUES (null,%s,%s,%s)
        """
        # 执行插入数据到数据库操作
        self.cursor.execute(insert_sql, (item['contain'], item['title'], item['time']))
        self.connect.commit()

    def close_spider(self, spider):
        # 关闭游标和连接
        self.cursor.close()
        self.connect.close()

settings部分

ITEM_PIPELINES = {
   'index_120.pipelines.Index120Pipeline': 300,
}

item部分

import scrapy


class Index120Item(scrapy.Item):

    contain = scrapy.Field()
    title = scrapy.Field()
    time = scrapy.Field()

运行结果及报错内容

C:\Users\Administrator\AppData\Local\Programs\Python\Python39\python.exe E:/0公司项目/爬虫/index_120/start.py
2022-05-28 12:16:06 [scrapy.utils.log] INFO: Scrapy 2.6.1 started (bot: index_120)
2022-05-28 12:16:06 [scrapy.utils.log] INFO: Versions: lxml 4.8.0.0, libxml2 2.9.12, cssselect 1.1.0, parsel 1.6.0, w3lib 1.22.0, Twisted 22.4.0, Python 3.9.5 (tags/v3.9.5:0a7dcbd, May  3 2021, 17:27:52) [MSC v.1928 64 bit (AMD64)], pyOpenSSL 22.0.0 (OpenSSL 3.0.3 3 May 2022), cryptography 37.0.2, Platform Windows-10-10.0.19044-SP0
2022-05-28 12:16:06 [scrapy.crawler] INFO: Overridden settings:
{'BOT_NAME': 'index_120',
 'DOWNLOAD_DELAY': 1,
 'NEWSPIDER_MODULE': 'index_120.spiders',
 'SPIDER_MODULES': ['index_120.spiders']}
2022-05-28 12:16:06 [scrapy.utils.log] DEBUG: Using reactor: twisted.internet.selectreactor.SelectReactor
2022-05-28 12:16:06 [scrapy.extensions.telnet] INFO: Telnet Password: 14bcee86c2d90ca1
2022-05-28 12:16:06 [scrapy.middleware] INFO: Enabled extensions:
['scrapy.extensions.corestats.CoreStats',
 'scrapy.extensions.telnet.TelnetConsole',
 'scrapy.extensions.logstats.LogStats']
2022-05-28 12:16:06 [scrapy.middleware] INFO: Enabled downloader middlewares:
['scrapy.downloadermiddlewares.httpauth.HttpAuthMiddleware',
 'scrapy.downloadermiddlewares.downloadtimeout.DownloadTimeoutMiddleware',
 'scrapy.downloadermiddlewares.defaultheaders.DefaultHeadersMiddleware',
 'scrapy.downloadermiddlewares.useragent.UserAgentMiddleware',
 'scrapy.downloadermiddlewares.retry.RetryMiddleware',
 'scrapy.downloadermiddlewares.redirect.MetaRefreshMiddleware',
 'scrapy.downloadermiddlewares.httpcompression.HttpCompressionMiddleware',
 'scrapy.downloadermiddlewares.redirect.RedirectMiddleware',
 'scrapy.downloadermiddlewares.cookies.CookiesMiddleware',
 'scrapy.downloadermiddlewares.httpproxy.HttpProxyMiddleware',
 'scrapy.downloadermiddlewares.stats.DownloaderStats']
2022-05-28 12:16:06 [scrapy.middleware] INFO: Enabled spider middlewares:
['scrapy.spidermiddlewares.httperror.HttpErrorMiddleware',
 'scrapy.spidermiddlewares.offsite.OffsiteMiddleware',
 'scrapy.spidermiddlewares.referer.RefererMiddleware',
 'scrapy.spidermiddlewares.urllength.UrlLengthMiddleware',
 'scrapy.spidermiddlewares.depth.DepthMiddleware']
2022-05-28 12:16:06 [scrapy.middleware] INFO: Enabled item pipelines:
['index_120.pipelines.Index120Pipeline']
2022-05-28 12:16:06 [scrapy.core.engine] INFO: Spider opened
连接数据库成功
2022-05-28 12:16:06 [scrapy.extensions.logstats] INFO: Crawled 0 pages (at 0 pages/min), scraped 0 items (at 0 items/min)
2022-05-28 12:16:06 [scrapy.extensions.telnet] INFO: Telnet console listening on 127.0.0.1:6023
2022-05-28 12:16:10 [filelock] DEBUG: Attempting to acquire lock 2326734878704 on C:\Users\Administrator\AppData\Local\Programs\Python\Python39\lib\site-packages\tldextract\.suffix_cache/publicsuffix.org-tlds\de84b5ca2167d4c83e38fb162f2e8738.tldextract.json.lock
2022-05-28 12:16:10 [filelock] DEBUG: Lock 2326734878704 acquired on C:\Users\Administrator\AppData\Local\Programs\Python\Python39\lib\site-packages\tldextract\.suffix_cache/publicsuffix.org-tlds\de84b5ca2167d4c83e38fb162f2e8738.tldextract.json.lock
2022-05-28 12:16:10 [filelock] DEBUG: Attempting to release lock 2326734878704 on C:\Users\Administrator\AppData\Local\Programs\Python\Python39\lib\site-packages\tldextract\.suffix_cache/publicsuffix.org-tlds\de84b5ca2167d4c83e38fb162f2e8738.tldextract.json.lock
2022-05-28 12:16:10 [filelock] DEBUG: Lock 2326734878704 released on C:\Users\Administrator\AppData\Local\Programs\Python\Python39\lib\site-packages\tldextract\.suffix_cache/publicsuffix.org-tlds\de84b5ca2167d4c83e38fb162f2e8738.tldextract.json.lock
2022-05-28 12:16:10 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.ssm.gov.mo/portal/news/ch/ss.aspx> (referer: None)
2022-05-28 12:16:10 [scrapy.core.scraper] ERROR: Spider error processing <GET https://www.ssm.gov.mo/portal/news/ch/ss.aspx> (referer: None)
Traceback (most recent call last):
  File "C:\Users\Administrator\AppData\Local\Programs\Python\Python39\lib\site-packages\twisted\internet\defer.py", line 857, in _runCallbacks
    current.result = callback(  # type: ignore[misc]
  File "C:\Users\Administrator\AppData\Local\Programs\Python\Python39\lib\site-packages\scrapy\spiders\__init__.py", line 67, in _parse
    return self.parse(response, **kwargs)
  File "C:\Users\Administrator\AppData\Local\Programs\Python\Python39\lib\site-packages\scrapy\spiders\__init__.py", line 70, in parse
    raise NotImplementedError(f'{self.__class__.__name__}.parse callback is not defined')
NotImplementedError: Spider120Spider.parse callback is not defined
2022-05-28 12:16:10 [scrapy.core.engine] INFO: Closing spider (finished)
2022-05-28 12:16:10 [scrapy.statscollectors] INFO: Dumping Scrapy stats:
{'downloader/request_bytes': 317,
 'downloader/request_count': 1,
 'downloader/request_method_count/GET': 1,
 'downloader/response_bytes': 27934,
 'downloader/response_count': 1,
 'downloader/response_status_count/200': 1,
 'elapsed_time_seconds': 3.420044,
 'finish_reason': 'finished',
 'finish_time': datetime.datetime(2022, 5, 28, 4, 16, 10, 371880),
 'log_count/DEBUG': 6,
 'log_count/ERROR': 1,
 'log_count/INFO': 10,
 'response_received_count': 1,
 'scheduler/dequeued': 1,
 'scheduler/dequeued/memory': 1,
 'scheduler/enqueued': 1,
 'scheduler/enqueued/memory': 1,
 'spider_exceptions/NotImplementedError': 1,
 'start_time': datetime.datetime(2022, 5, 28, 4, 16, 6, 951836)}
2022-05-28 12:16:10 [scrapy.core.engine] INFO: Spider closed (finished)

我的解答思路和尝试过的方法

一开始想用异步写入，报错也是这样的，换成同步还是这样
DEBUG: Crawled (200) <GET https://www.ssm.gov.mo/portal/news/ch/ss.aspx> (referer: None)也能获取到数据
不使用scrapy框架，直接写爬虫能正常存储到csv或者数据库

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
烟台大林子 2022-05-28 14:06
关注
看报错信息，是提示的写的爬虫有未实现的错误（parse方法）

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python基于scrapy框架爬取数据并写入到MySQL和本地
2022-07-20 12:11

阿里多多酱a的博客基于scrapy框架爬取内容，持久化存储到本地和MySQL
利用scrapy将爬到的数据保存到mysql（防止重复）
2021-01-20 05:06

本文主要给大家介绍了关于scrapy爬到的数据保存到mysql（防止重复）的相关内容，分享出来供大家参考学习，下面话不多说了，来一起看看详细的介绍吧。 1.环境建立 1.使用xmapp安装php, mysql ,phpmyadmin 2....
Python3实现的爬虫爬取数据并存入mysql数据库操作示例
2020-09-09 09:34

在本示例中，我们将深入探讨如何使用Python3编写一个简单的网络爬虫，该爬虫能够抓取特定网页上的数据，并将这些数据存储到MySQL数据库中。首先，我们需要了解几个关键的Python库，包括`requests`、`re`（正则表达式...
【python爬虫】scrapy框架案例实现数据保存入MySQL
2022-05-23 11:42

王同学在这的博客往期知识点往期内容回顾【python爬虫】纵横中文网python实战【python教程】保姆版教使用pymysql模块连接MySQL实现增删改查 selenium自动化测试实战案例哔哩哔哩信息至Excel 舍友打一把游戏的时间，我实现了一个...
python写入MySQL数据库
2018-11-15 21:22

弓长弓长的博客将数据写入数据库；关闭数据库。 1.连接数据库 在连接自己的数据库之前我们应先导入import MySQLdb模块 host：自己的主机号，一般写127.0.0.1就可以了 port：端口号 user：root passwd：密码 db：连接...
python数据批量写入数据库_python scrapy框架通过pipelines批量存储万条数据到mysql数据库...
2020-12-04 13:58

weixin_39852121的博客本文利用mysql 的excutemany()函数实现批量存储，同时需要建立一个缓冲池来存放数据。# -*- coding: utf-8 -*-#!DATE: 2018/7/15 13:26#!@Author: yyimport sysimport MySQLdbdefault_encoding = 'utf-8'if...
python爬虫自学宝典——将爬取的数据写入MySQL数据库
2020-03-26 21:08

良木66的博客上一节介绍了怎么将信息写入json中，这一节讲怎么将爬取的信息写入MySQL数据库中。写入数据库中，其实只需要修改pipeline.py文件即可，凡是输出，都只需要修改pipeline文件即可。打开pipeline文件，咱们上一节写入...
『scrapy爬虫』06. 向mysql数据库中批量写入数据（详细注释步骤）
2024-03-17 10:08

发现你走远了的博客『scrapy爬虫』06. 向mysql数据库中批量写入数据（详细注释步骤）
scrapy数据存储在mysql数据库的两种方式(同步和异步)
2021-01-20 01:49

self.connect = pymysql.connect(host='XXX', user='root', passwd='XXX', db='scrapy_test') # 后面三个依次是数据库连接名、数据库密码、数据库名称 # get cursor self.cursor = self.conne
Python MySQL安装+Scrapy爬虫将Item写入mysql数据库
2016-10-28 13:28

夏天7788的博客这很显然不满足我们日常的实际应用，接下来看下如何将抓取的内容保存在常见的mysql数据库中吧。　说明：所有的操作都是在“scrapy爬虫成长日记之创建工程-抽取数据-保存为json格式的数据”的基础上完成，
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 5月28日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 5月28日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月28日

scrapy无法将数据写入mysql数据库

scrapy无法将数据写入mysql数据库，不用scrapy直接写爬虫可以存到mysql

问题相关代码

运行结果及报错内容

我的解答思路和尝试过的方法

1条回答 默认 最新

问题事件

1条回答默认最新