请问no module named xxx.spiders报错怎么解决

我初学scrapy爬虫，在github上下载了一个工程用pycharm运行了一下是没有问题的，然后在cmd中通过scrapy crawl xiaohuar 的命令运行爬虫的时候出现了 no module named xiaohuar.spiders 的报错

代码如下：

#coding=utf-8
import scrapy
import re
import os
import urllib
from scrapy.selector import Selector
from scrapy.http import HtmlResponse, Request

class Xiaohuar_spider(scrapy.spiders.Spider):
name = "xiaohuar"

allowed_domains = ["xiaohuar.com"] # 搜索的域名范围，也就是爬虫的约束区域，规定爬虫只爬取这个域名下的网页

start_urls = ["http://www.xiaohuar.com/list-1-1.html"]

该函数名不能改变，因为Scrapy源码中默认callback函数的函数名就是parse

def parse(self, response):
current_url = response.url # 爬取时请求的url
body = response.body # 返回的html
unicode_body = response.body_as_unicode() # 返回的html unicode

hxs = Selector(response) # 创建查询对象，HtmlXPathSelector已过时

if re.match('http://www.xiaohuar.com/list-1-\d+.html', response.url): # 如果url能够匹配到需要爬取的url，就爬取
items = hxs.xpath('//div[@class="item_list infinite_scroll"]/div') # 匹配到大的div下的所有小div（每个小div中包含一个图片）

for i in range(len(items)): # 遍历div个数
src = hxs.xpath(
'//div[@class="item_list infinite_scroll"]/div[%d]//div[@class="img"]/a/img/@src' % i).extract() # 查询所有img标签的src属性，即获取校花图片地址
name = hxs.xpath(
'//div[@class="item_list infinite_scroll"]/div[%d]//div[@class="img"]/span/text()' % i).extract() # 获取span的文本内容，即校花姓名
school = hxs.xpath(
'//div[@class="item_list infinite_scroll"]/div[%d]//div[@class="img"]/div[@class="btns"]/a/text()' % i).extract() # 校花学校

if src:
absoluteSrc = "http://www.xiaohuar.com" + src[
0] # 拼接实际路径,因为.extract()会返回一个list，但是我们是依次取得div，所以是取第0个
file_name = "%s_%s.jpg" % (school[0], name[0]) # 拼接文件名，学校_姓名
file_path = os.path.join("E:\file", file_name) # 拼接这个图片的路径下
urllib.urlretrieve(absoluteSrc, file_path) # 接收文件路径和需要保存的路径，会自动去文件路径下载并保存到我们指定的本地路径

all_urls = hxs.xpath('//a/@href').extract() # 提取界面所有的url
for url in all_urls: # 遍历获得的url，如果满足条件，继续爬取
if url.startswith('http://www.xiaohuar.com/list-1-'):
yield Request(url, callback=self.parse)

图片说明
整个工程的文件就是这样
请问各位大神这个问题出在哪里，怎么解决呢？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
Double_Click007 2017-05-26 13:34
关注
这是因为调用的方法不在同一个目录下面，pycharm能够找到，但是在cmd上或者Linux系统上运行，就会出错；你可以在首行加入以下代码：

import sys reload(sys) sys.path.append("../")
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

求问：ModuleNotFoundError: No module named 'tencent.settings' python
2020-02-10 12:16

回答 1 已采纳 https://www.cnblogs.com/dreamyu/p/7889959.html
用scrapy爬到一半时停止并报错invalid session id python 爬虫
2022-01-04 16:58

回答 1 已采纳这位博友情况跟你的有点类似，你可以借鉴一下 https://blog.csdn.net/weixin_35757704/article/details/120706276
scrapy框架问题报错？ python
2020-03-22 13:23

回答 1 已采纳 https://www.cnblogs.com/ArsenalfanInECNU/p/5346751.html
自定义的模块导入时出现“No module named XXX”的解决方案
2021-07-19 15:22

XiHong_Z的博客自定义的模块导入时出现“No module named XXX”的解决方案 from A.a import B 在A文件夹里面加入一个空的__init__.py文件
请问Python爬虫如何把爬取数据存入csv文件中 python 开发语言有问必答爬虫
2021-11-21 21:19

回答 1 已采纳你用open打开csv文件，然后以字符串格式写入就行了，每个数据之间用英文逗号隔开即可
我用xpath提取标签属性内容时，一直给我返回的时空列表后端
2021-11-03 10:02

回答 1 已采纳它的src写的“ no Spiders are not allowed to crawl!”，做了反爬虫处理的！
关于#python#的问题：用Python爬取网页时，直接运行for语句下的代码可正常运行，加入for语句进行循环则报错 python 爬虫
2023-01-04 12:32

回答 3 已采纳 01.html和1.html很显然不是同一个网址，你在错误的网址下当然抓不到东西，是空的改成 target = f"http://paper.people.com.cn/rmrb/html/20{ye
Pyhton 解决ModuleNotFoundError: No module named ‘xxx‘
2021-08-02 10:06

woleto的博客但是通过终端运行run.sh提示ModuleNotFoundError: No module named ‘src’，明明目录下有src啊，这时候就考虑是不是路径的问题了。ide中的默认项目路径与终端不一样，只要在代码里将src的父目录加到路径中即可，...
爬取途牛机票信息报错--TypeError: string indices must be integers json list python
2019-08-07 15:08

回答 1 已采纳把for each in airbasic['flightMap']:这句改成for each in airbasic['flightMap'].values():，再试试。因为data['air
请问python中调用类的方法怎么调用 python
2018-09-11 11:35

回答 4 已采纳你这里的canshu()和order()都是实例方法，如果当做普通的函数来调用，应该以一个实例对象作为第一个参数。你在order函数的定义里对它的第一个参数self调用了self.canshu()
用scrapy爬取站长素材无法下载图片 python 爬虫
2021-08-03 18:51

回答 2 已采纳找到原因了，是要在setting中加上MEDIA_ALLOW_REDIRECTS = True，貌似是中间件的内容，我还没学到，所以不清楚什么意思，有大佬可以解释一下吗看所有日志后会发现其实有地方报错
Scrapy项目报错：no model name ‘xx.setting‘
2022-01-25 11:23

川野先生的博客我反复检查settings.py中的设置，甚至还读了源码，找了各种解答，都没有解决。着急上火的时候，改了一下文件名，再试试就行了，就挺傻宝的。原来的文件名：带有数字、空格和小数点新文件名：然后就好了，可以...
在以瀑布流方式翻页的网站,使用scrapy网络爬虫,但是只爬取了第一页数据,没有爬取第二页. python 爬虫
2021-09-05 19:18

回答 2 已采纳那叫ajax，
scrapy项目命令行执行报错：No module named:***解决办法
2018-07-07 22:04

JimmyMcgilI的博客要执行的文件路径：D:\py_workspace\my_scrapy_prjs\jianshu_spider\jianshu\spiders\jianshu_sp.py，在此目录下打开命令行执行python jianshu_sp.py报错：No module named 'jianshu'。报错原因：import语句如下：...
Python3.6 Error: ModuleNotFoundError: No module named ‘src‘
2020-12-04 15:52

条件漫步的博客出现了错误：ModuleNotFoundError: No module named ‘src’ 2、尝试的方式（1）增加系统路径（测试成功） sys.path.insert(0, ‘…/’) import sys, os sys.path.insert(0, '../') from setup import LOGFILE, NOW...
Scrapy 模块不存在的错误（ModuleNotFoundError: No module named xxx）
2019-01-30 19:44

Felix-微信(Felixzfb)的博客实现的案例： scrapy 图片下载（一）：三行代码实现scrapy图片下载 ...1. 错误1：没有模块直接Pycharm中运行爬虫主程序代码，会提示以下错误 ...module> from ImageSpider.items import ImagespiderItem Modul...
在命令行中执行python，提示提示No module named "xxx"
2018-08-29 10:30

无恋-zx的博客在命令行中执行python，提示提示No module named "xxx" 问题：用JetBrains写了一个python程序，运行scheduleWindow.py，在JetBrains中可以正确执行，然而用命令行执行的时候始终提示15行error，...
Scrapyd部署项目后启动报错，无法找到模块No module named xxxx(已解决)
2019-07-01 01:37

仲冬初七的博客 Scrapyd部署项目后启动报错，无法找到模块No module named xxxx(已解决) 前置操作爬虫本地测试无任何问题，正常部署到scrapyd中，无异常报错通过远程启动爬虫报错提示No module named xxxx 原因 scrapyd没有将...
scrapy实现分布式爬虫以及布隆过滤器，scrapy-redis所遇到的问题，终端进入虚拟环境
2022-11-05 21:30

Hares_的博客记录一下scrapy实现分布式爬虫以及布隆过滤器的使用：所用版本： pip install scrapy==2.5.1 pip install scrapy-redis==0.7.2 版本问题，有的版本过高会导致scrapy-... 报错：from collections import Iterable Im
Windows中Python3.x下运行Python2.x程序解决方案
2018-10-30 21:46

专业打豆豆的博客 Windows中Python3.x下运行Python2.x程序解决方案。问题描述与分解场景和适用范围思路与分解本文环境介绍使用pyinstaller打包python2.x下的Scrapy工程在python 3.x环境下调用exe文件问题描述与分解声明：本文实践...
没有解决我的问题, 去提问

悬赏问题

¥30 求一段fortran代码用IVF编译运行的结果
¥15 深度学习根据CNN网络模型，搭建BP模型并训练MNIST数据集
¥15 lammps拉伸应力应变曲线分析
¥15 C++ 头文件/宏冲突问题解决
¥15 用comsol模拟大气湍流通过底部加热（温度不同）的腔体
¥50 安卓adb backup备份子用户应用数据失败
¥20 有人能用聚类分析帮我分析一下文本内容嘛
¥15 请问Lammps做复合材料拉伸模拟，应力应变曲线问题
¥30 python代码，帮调试，帮帮忙吧
¥15 #MATLAB仿真#车辆换道路径规划

请问no module named xxx.spiders报错怎么解决

该函数名不能改变，因为Scrapy源码中默认callback函数的函数名就是parse

1条回答 默认 最新

悬赏问题

1条回答默认最新