weixin_46415501
weixin_46415501
2020-03-22 13:23
采纳率: 66.7%
浏览 348

scrapy框架问题报错?

import scrapy
import bs4
from ..items import DoubanItem

需要引用DoubanItem,它在items里面。因为是items在top250.py的上一级目录,所以要用..items,这是一个固定用法。

class DoubanSpider(scrapy.Spider): #定义一个爬虫类DoubanSpider
name = 'douban'
allower_domains = ['book.douban.com'] #定义允许爬虫爬取的网址域名
start_urls = []
for x in range(3):
url = 'https://book.douban.com/top250?start=' + str(x * 25) #定义起始网址
start_urls.append(url)

def parse(self,response):
#parse是默认处理response的方法。
    bs = bs4.BeautifulSoup(response.text,'html.parse')
    #用BeautifulSoup解析response。
    datas = bs.find_all('tr',class_="item")
    #用find_all提取<tr class="item">元素,这个元素里含有书籍信息。
    for data in datas:
    #遍历data。
        item = doubanItem()
        #实例化DoubanItem这个类。
        item['title'] = data.find_all('a')[1]['title']
        #提取出书名,并把这个数据放回DoubanItem类的title属性里。
        item['publish'] = data.find('p',class_='pl').text
        #提取出出版信息,并把这个数据放回DoubanItem类的publish里。
        item['score'] = data.find('span',class_='rating_nums').text
        #提取出评分,并把这个数据放回DoubanItem类的score属性里。
        print(item['title'])
        #打印书名。
        yield item
        #yield item是把获得的item传递给引擎。



    Traceback (most recent call last):

File "D:\hello-world.py\pythoncode\douban\douban\spiders\top250.py", line 3, in
from ..items import DoubanItem
ValueError: attempted relative import beyond top-level package

网上的办法试了几种都w'x,不知道是我搞错了还是什么问题,求解!!!

  • 点赞
  • 写回答
  • 关注问题
  • 收藏
  • 邀请回答

1条回答 默认 最新

相关推荐