scrapy在创建爬虫文件时候url的错误

在控制台打的是这个命令
地址是： https://www.autohome.com.cn/b/

但是当我打开爬虫文件，看到里面的

start_urls = ["http://www.autohome.com.cn/"]

只能爬网站的主页吗？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
阳光宅男xxb 2023-04-20 08:11
关注
是这样的，没问题。scrapy认为加了/b/的不是一个正确的网站，因为一般的网站首页都是.com .cn这样结尾的。所以默认去掉了后面的。需要自己手动修改的。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

scrapy简单分布式爬虫
2024-06-21 15:11

Python老吕的博客 Scrapy作为一款强大的Python爬虫框架，结合Redis等消息队列服务，可以轻松地实现分布式爬虫。通过分布式爬虫，我们可以充分利用多台机器的硬件资源和网络带宽，提高爬取效率。然而，在实际应用中，我们还需要考虑...
Python 后端爬虫Scrapy 框架使用
2018-12-04 14:41

cx羽的博客 Python 后端爬虫Scrapy 框架使用：
毕业设计-基于Scrapy-redis的分布式爬虫Web平台
2024-05-12 16:41

毕业设计项目“基于Scrapy-redis的分布式爬虫Web平台”是将Scrapy爬虫框架与Redis数据库结合，实现一个高效、可扩展的分布式爬虫系统。该项目利用SSM（Spring、SpringMVC、MyBatis）框架构建前端Web界面，提供用户...
一个使用scrapy和redis搭建的分布式爬虫搜索引擎
2024-02-23 18:09

- **项目结构**：包括Scrapy爬虫项目的基本目录结构，如`spiders`（存放爬虫代码）、`settings.py`（配置文件）、`pipelines.py`（数据处理管道）、`middlewares.py`（中间件）等。 - **Redis配置**：在`settings....
Scrapy Web爬虫框架 v1.1.3
2020-12-04 17:10

此外，Scrapy还提供了命令行工具，用于创建新项目、生成Spider、启动爬虫等操作。总的来说，Scrapy 1.1.3作为一款高效的Python爬虫框架，提供了全面的功能，简化了网络数据抓取的复杂性，让开发者可以专注于数据的...
基于Scrapy、Redis、MongoDB和Graphite的分布式网络爬虫设计源码
2024-10-08 13:46

在这个系统中，Scrapy作为爬虫的主要抓取工具，负责从网络上爬取数据。Redis作为消息队列使用，管理待爬取的URL和爬取任务，确保爬虫的高效运行和分布式处理。MongoDB则作为后端存储，保存抓取到的数据，并且支持大...
【0基础学爬虫】爬虫基础之scrapy的使用
2024-07-01 16:41

K哥爬虫的博客它提供了简单易用的工具和组件，使开发者能够定义爬虫、调度请求、处理响应并存储提取的数据。Scrapy 具有高效的异步处理能力，支持分布式爬取，通过其中间件和扩展机制可以方便地定制和扩展功能，广泛应用于数据...
基于scrapy爬虫实现对imdb数据的采集，并使用flask进行展示.zip
2024-01-03 01:46

在这个项目中，Flask被用作前端展示平台，接收来自Scrapy爬虫的数据并以用户友好的方式展示。开发人员可能创建了路由来处理HTTP请求，定义了视图函数来返回HTML模板，这些模板中可能嵌入了爬取到的IMDb数据，让用户...
定向爬虫：Scrapy与Redis入门
2018-11-13 14:50

当Scrapy与Redis结合时，我们可以创建一个分布式爬虫系统。首先，Scrapy可以将待抓取的URL放入Redis的队列中，这样多个Scrapy实例可以并行地从队列中取出URL进行抓取，大大提高了爬取效率。同时，Redis还可以用于...
超详细Python教程——爬虫框架Scrapy简介
2024-07-21 14:00

月流霜的博客答案是肯定的，那就是利用爬虫框架，而在所有的爬虫框架中，Scrapy 应该是最流行、最强大的框架。Scrapy 是基于 Python 的一个非常流行的网络爬虫框架，可以用来抓取 Web 站点并从页面中提取结构化的数据。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 4月28日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 4月20日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 4月19日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月19日

scrapy在创建爬虫文件时候url的错误

1条回答 默认 最新

问题事件

1条回答默认最新