YvMoYvMo 2023-04-19 23:01 采纳率: 85%
浏览 10
已结题

scrapy在创建爬虫文件时候url的错误

在控制台打的是这个命令
地址是: https://www.autohome.com.cn/b/

img

但是当我打开爬虫文件,看到里面的

start_urls = ["http://www.autohome.com.cn/"]

img


只能爬网站的主页吗?

  • 写回答

1条回答 默认 最新

  • 阳光宅男xxb 2023-04-20 08:11
    关注

    是这样的,没问题。scrapy认为加了/b/的不是一个正确的网站,因为一般的网站首页都是.com .cn这样结尾的。所以默认去掉了后面的。需要自己手动修改的。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 4月28日
  • 已采纳回答 4月20日
  • 修改了问题 4月19日
  • 创建了问题 4月19日

悬赏问题

  • ¥15 找一个QT页面+目标识别(行人检测)的开源项目
  • ¥15 有没有整苹果智能分拣线上图像数据
  • ¥20 有没有人会这个东西的
  • ¥15 cfx考虑调整“enforce system memory limit”参数的设置
  • ¥30 航迹分离,航迹增强,误差分析
  • ¥15 Chrome Manifest扩展引用Ajax-hook库拦截请求失败
  • ¥15 用Ros中的Topic通讯方式控制小乌龟的速度,走矩形;编写订阅器代码
  • ¥15 LLM accuracy检测
  • ¥15 pycharm添加远程解释器报错
  • ¥15 如何让子窗口鼠标滚动独立,不要传递消息给主窗口