思念渐远记忆犹新 2022-05-01 10:53
浏览 12
已结题

scrapy中spiders构建时传入的网址与创建后的spiders中的网址不一致

当我在win+r中创建新的spiders文件夹后,我在其中写入以下代码:
scrapy genspider car http://car.autohome.com.cn/price/brand-15.html

按照我学习的网课中的老师的结果,在pycharm中应显示以下代码:
import scrapy

class CarSpider(scrapy.Spider):
name = 'car'
allowed_domains = ['car.autohome.com.cn/price/brand-15.html']
start_urls = ['http://car.autohome.com.cn/price/brand-15.html']

def parse(self, response):
    pass

但实际上我的结果是:
import scrapy

class CarSpider(scrapy.Spider):
name = 'car'
allowed_domains = ['car.autohome.com.cn']
start_urls = ['http://car.autohome.com.cn']

def parse(self, response):
    pass

可见在allwoed_domains和start_urls中网址的部分没有录入,因此每次我打开的网页都是网站首页,而不是我想要的网页
感谢赐教!

  • 写回答

0条回答 默认 最新

    报告相同问题?

    问题事件

    • 系统已结题 5月9日
    • 创建了问题 5月1日

    悬赏问题

    • ¥15 三极管电路求解,已知电阻电压和三级关放大倍数
    • ¥15 ADS时域 连续相位观察方法
    • ¥15 Opencv配置出错
    • ¥15 模电中二极管,三极管和电容的应用
    • ¥15 关于模型导入UNITY的.FBX: Check external application preferences.警告。
    • ¥15 气象网格数据与卫星轨道数据如何匹配
    • ¥100 java ee ssm项目 悬赏,感兴趣直接联系我
    • ¥15 微软账户问题不小心注销了好像
    • ¥15 x264库中预测模式字IPM、运动向量差MVD、量化后的DCT系数的位置
    • ¥15 curl 命令调用正常,程序调用报 java.net.ConnectException: connection refused