weixin_46415501 2020-03-22 13:23 采纳率: 66.7%
浏览 436
已采纳

scrapy框架问题报错?

import scrapy
import bs4
from ..items import DoubanItem

需要引用DoubanItem,它在items里面。因为是items在top250.py的上一级目录,所以要用..items,这是一个固定用法。

class DoubanSpider(scrapy.Spider): #定义一个爬虫类DoubanSpider
name = 'douban'
allower_domains = ['book.douban.com'] #定义允许爬虫爬取的网址域名
start_urls = []
for x in range(3):
url = 'https://book.douban.com/top250?start=' + str(x * 25) #定义起始网址
start_urls.append(url)

def parse(self,response):
#parse是默认处理response的方法。
    bs = bs4.BeautifulSoup(response.text,'html.parse')
    #用BeautifulSoup解析response。
    datas = bs.find_all('tr',class_="item")
    #用find_all提取<tr class="item">元素,这个元素里含有书籍信息。
    for data in datas:
    #遍历data。
        item = doubanItem()
        #实例化DoubanItem这个类。
        item['title'] = data.find_all('a')[1]['title']
        #提取出书名,并把这个数据放回DoubanItem类的title属性里。
        item['publish'] = data.find('p',class_='pl').text
        #提取出出版信息,并把这个数据放回DoubanItem类的publish里。
        item['score'] = data.find('span',class_='rating_nums').text
        #提取出评分,并把这个数据放回DoubanItem类的score属性里。
        print(item['title'])
        #打印书名。
        yield item
        #yield item是把获得的item传递给引擎。



    Traceback (most recent call last):

File "D:\hello-world.py\pythoncode\douban\douban\spiders\top250.py", line 3, in
from ..items import DoubanItem
ValueError: attempted relative import beyond top-level package

网上的办法试了几种都w'x,不知道是我搞错了还是什么问题,求解!!!

  • 写回答

1条回答 默认 最新

  • threenewbee 2020-03-22 19:02
    关注
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

悬赏问题

  • ¥15 多电路系统共用电源的串扰问题
  • ¥15 slam rangenet++配置
  • ¥15 有没有研究水声通信方面的帮我改俩matlab代码
  • ¥15 对于相关问题的求解与代码
  • ¥15 ubuntu子系统密码忘记
  • ¥15 信号傅里叶变换在matlab上遇到的小问题请求帮助
  • ¥15 保护模式-系统加载-段寄存器
  • ¥15 电脑桌面设定一个区域禁止鼠标操作
  • ¥15 求NPF226060磁芯的详细资料
  • ¥15 使用R语言marginaleffects包进行边际效应图绘制