weixin_46415501 2020-03-22 13:23 采纳率: 66.7%
浏览 432
已采纳

scrapy框架问题报错?

import scrapy
import bs4
from ..items import DoubanItem

需要引用DoubanItem,它在items里面。因为是items在top250.py的上一级目录,所以要用..items,这是一个固定用法。

class DoubanSpider(scrapy.Spider): #定义一个爬虫类DoubanSpider
name = 'douban'
allower_domains = ['book.douban.com'] #定义允许爬虫爬取的网址域名
start_urls = []
for x in range(3):
url = 'https://book.douban.com/top250?start=' + str(x * 25) #定义起始网址
start_urls.append(url)

def parse(self,response):
#parse是默认处理response的方法。
    bs = bs4.BeautifulSoup(response.text,'html.parse')
    #用BeautifulSoup解析response。
    datas = bs.find_all('tr',class_="item")
    #用find_all提取<tr class="item">元素,这个元素里含有书籍信息。
    for data in datas:
    #遍历data。
        item = doubanItem()
        #实例化DoubanItem这个类。
        item['title'] = data.find_all('a')[1]['title']
        #提取出书名,并把这个数据放回DoubanItem类的title属性里。
        item['publish'] = data.find('p',class_='pl').text
        #提取出出版信息,并把这个数据放回DoubanItem类的publish里。
        item['score'] = data.find('span',class_='rating_nums').text
        #提取出评分,并把这个数据放回DoubanItem类的score属性里。
        print(item['title'])
        #打印书名。
        yield item
        #yield item是把获得的item传递给引擎。



    Traceback (most recent call last):

File "D:\hello-world.py\pythoncode\douban\douban\spiders\top250.py", line 3, in
from ..items import DoubanItem
ValueError: attempted relative import beyond top-level package

网上的办法试了几种都w'x,不知道是我搞错了还是什么问题,求解!!!

  • 写回答

1条回答 默认 最新

  • threenewbee 2020-03-22 19:02
    关注
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

    报告相同问题?

    悬赏问题

    • ¥15 Qt 不小心删除了自带的类,该怎么办
    • ¥15 我需要在PC端 开两个抖店工作台客户端.(语言-java)
    • ¥15 有没有哪位厉害的人可以用C#可视化呀
    • ¥15 可以帮我看看代码哪里错了吗
    • ¥15 设计一个成绩管理系统
    • ¥15 PCL注册的选点等函数如何取消注册
    • ¥15 问一下各位,为什么我用蓝牙直接发送模拟输入的数据,接收端显示乱码呢,米思齐软件上usb串口显示正常的字符串呢?
    • ¥15 Python爬虫程序
    • ¥15 crypto 这种的应该怎么找flag?
    • ¥15 代码已写好,求帮我指出错误,有偿!