scrapy框架，python爬虫

import scrapy
from neihanPro.items import NeihanproItem


class NeihanSpider(scrapy.Spider):
    name = "neihan"
    #allowed_domains = ["www.xxx.com"]
    start_urls = ["https://www.neihantv.cn/"]


    ##基于管道的可持续化存储
    def parse(self, response):
        #解析：作者名称和段子内涵
        dl_list=response.xpath("//div[@class='main-left fl']/dl")
        all_data=[]#创建一个存储所有数据的列表，其中的元素是字典
        for dl in dl_list:
            #xpath返回的是列表，但是列表元素一定是selector类型的对象
            #extract（）可以将selector对象中的data参数存储的字符串提取出来
            author=dl.xpath("./dt/p/a[1]/text()")[0].extract()
            #列表content调用了extract（）之后，则表示将列表中的每一个selector对象中data对应的字符串提取了出来
            content=dl.xpath("./dt/span/a/text()").extract()
            content="".join(content)

            #实例化一个item对象
            #将解析到的数据封装到item对象的属性中
            item=NeihanproItem()
            item["author"]=author
            item["content"]=content

            yield item#将item提交给管道

Traceback (most recent call last):
  File "D:\python系统学校\Pycharm\爬虫\第八章scrapy框架\neihanPro\neihanPro\spiders\neihan.py", line 2, in <module>
    from neihanPro.items import NeihanproItem
ModuleNotFoundError: No module named 'neihanPro'

请求帮忙解决，文件名没输错，目录位置没错，用了import sys也不行，谢谢

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
阳光宅男xxb 2023-05-30 15:38
关注
刚遇到过，修改为：
from ..items import NeihanproItem

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

python爬虫学习笔记-scrapy框架(1)
2023-01-29 12:24

python爬虫学习笔记-scrapy框架(1) python scrapy 爬虫 python爬虫学习笔记-scrapy框架(1) python scrapy 爬虫 python爬虫学习笔记-scrapy框架(1) python scrapy 爬虫 python爬虫学习笔记-scrapy框架(1) python ...
python爬虫学习笔记-scrapy框架(2)
2023-01-29 12:21

python爬虫学习 scrapy框架爬虫学习 scrapy python爬虫学习 scrapy框架爬虫学习 scrapy python爬虫学习 scrapy框架爬虫学习 scrapypython爬虫学习 scrapy框架爬虫学习python爬虫学习 scrapy框架爬虫学习python...
Python 后端爬虫Scrapy 框架使用
2018-12-04 14:41

cx羽的博客 Python 后端爬虫Scrapy 框架使用：
超详细Python教程——爬虫框架Scrapy简介
2024-07-21 14:00

月流霜的博客当你写了很多个爬虫程序之后，你会发现每次写爬虫程序时，都需要将页面获取、页面解析、爬虫调度、异常处理...Scrapy 是基于 Python 的一个非常流行的网络爬虫框架，可以用来抓取 Web 站点并从页面中提取结构化的数据。
网络爬虫与数据管理_基于Python的Scrapy框架与Django后端_微博API授权OAuth20协议_多线程分布式爬虫调度系统_MySQL数据库存储与Redis缓存_用户配.zip
2025-07-15 13:57

本文将详细探讨网络爬虫与数据管理相关的技术要点，特别是在Python环境下使用Scrapy框架和Django后端结合微博API授权OAuth20协议，以及如何设计一个多线程分布式爬虫调度系统，存储数据至MySQL数据库，并使用Redis...
Python中Scrapy框架
2022-04-15 13:57

码海探幽的博客文章目录Scrapy 框架一、简介1、介绍2、环境配置3、常用命令4、运行原理4.1 流程图4.2 部件简介4.3 运行流程二、创建项目1、修改配置2、创建一个项目3、定义数据4、编写并提取数据5、存储数据6、运行...
优雅地进行Python爬虫后端开发
2023-09-14 17:13

BbflNim的博客本文将介绍如何以优雅的方式进行Python爬虫后端开发，并提供相应的源代码示例。在开始爬虫后端开发之前，首先需要明确爬取的目标。确定要爬取的网站、所需的数据类型以及数据获取的方式。这有助于我们设计合适的爬虫...
Python Scrapy 爬虫框架demo
2018-12-04 14:47

总之，"Python Scrapy 爬虫框架demo"是一个很好的学习资源，它展示了Scrapy框架如何结合数据库实现数据抓取和存储。通过深入研究和实践，你可以掌握Scrapy的核心功能，并具备开发高效、稳定的爬虫项目的能力。
基于Python的Scrapy爬虫项目设计源码
2024-09-23 16:44

本项目即是利用Scrapy框架进行设计的爬虫源码，具体表现为一个包含大量文件的压缩包，其中绝大多数为图片资源，另有文档和核心的Python爬虫代码，适合于不同的数据抓取需求。 Scrapy是Python开发的一个快速、高层次...
利用scrapy框架进行分布式爬虫
2019-12-04 21:40

scrapy提供了多种类型爬虫的基类，如BaseSpider、sitemap爬虫等，是一个为爬取网站数据、提取结构性数据而设计的应用程序框架，它可以应用在广泛领域
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 6月7日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 5月30日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月28日

scrapy框架，python爬虫

3条回答 默认 最新

问题事件

3条回答默认最新