关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
木目-
2016-02-13 13:08
采纳率: 0%
浏览 3696
首页
爬虫过程中同一URL是不同的网页内容,这样的可能会漏掉很多网页,这种问题怎么解决
爬虫
比如网站会根据不同的城市显示不同的网页内容,但URL是一样的,爬虫应该采取什么措施防止漏掉这些页面
收起
写回答
好问题
0
提建议
关注问题
微信扫一扫
点击复制链接
分享
邀请回答
编辑
收藏
删除
结题
收藏
举报
3
条回答
默认
最新
关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
oyljerry
2016-02-13 14:23
关注
直接拿到不同城市请求的那个URL,然后获取内容
本回答被题主选为最佳回答
, 对您是否有帮助呢?
本回答被专家选为最佳回答
, 对您是否有帮助呢?
本回答被题主和专家选为最佳回答
, 对您是否有帮助呢?
解决
无用
评论
打赏
微信扫一扫
点击复制链接
分享
举报
评论
按下Enter换行,Ctrl+Enter发表内容
查看更多回答(2条)
向“C知道”追问
报告相同问题?
提交
关注问题
网络
爬虫
Spider--一篇搞懂(入门基础知识-网络、并发、练习网站,初级
爬虫
-Requests、BeautifulSoup库,
中
级
爬虫
-Scrapy框架,高级
爬虫
-动态页面、反
爬虫
,部署,含代码)
2025-01-13 04:42
LetItRun的博客
对于动态内容,Selenium或Playwright等工具模拟浏览器执行JavaScript和处理AJAX请求。Scrapy框架管理爬取流程,支持登录和Token验证,并通过代理和其他策略应对反爬措施。爬取的数据可存入数据库或导出为文件,...
有哪些网站用
爬虫
爬取能得到很有价值的数据?
2019-05-05 17:47
BC_COM的博客
回顾2016年,我用
爬虫
做了
很多
事情。 1、微信好友的
爬虫
,了解一下你的好友全国分布,男女比例,听起来似乎是一个不错的想法,当然你还可以识别一下你的好友有多少人是用自己照片作为头像的,详细的内容可以点击...
python
后端
web框架知识整理
2019-09-03 18:46
岳来的博客
python
后端
web框架知识整理
API网关:微服务时代的统一门卫
2025-08-27 23:54
你一身傲骨怎能输的博客
同时分析了没有API网关时
可能
面临的安全风险、运维混乱等
问题
,特别是微服务架构下API数量激增带来的管理挑战。API网关通过集
中
化管理,实现了服务隐藏、统一出口、动态配置等优势,是现代化系统架构不可或缺的组件
最强面试题整理第三弹:Python 后台开发面试题(附答案)
2021-08-18 14:54
Rocky0429的博客
Python 面试的时候,
会
涉及到
很多
的八股文,我结合自己的经验,整理Python 最强面试题。 Python 最强面试题主要包括以下几方面: Python 基础(已完成) Python 进阶(已完成) Python 后台开发
爬虫
机器学习 对...
「查漏补缺」2020 截止9月2日 秋招前端面试经历 (已整理答案)
2020-09-02 12:00
一百个Chocolate的博客
成功是一个
过程
,并不是一个结果。励志做一位优秀的前端博主,今天分享最近的面试记录(含答案)
前端面试常见
问题
——Web篇
2025-07-15 19:02
苹果醋3的博客
优点是不需要关注埋点逻辑,不
会
出现漏埋、误埋等现象,缺点是自定义属性不灵活,传输时效性差,数据可靠性欠佳,耗费网络流量,还
会
增加服务器负载 上报周期 如果埋点的事件不是
很多
,上报可以实时进行 如果埋点的...
系统性能优化的十大策略(强烈推荐,建议收藏)
2022-11-21 09:45
Java知音_的博客
分为上
中
下三篇,由浅及深的写了关于性能优化的方方面面,并不仅仅局限于代码层面,希望小伙伴们能有所收获。引言:取与舍软件设计开发某种意义上是“取”与“舍”的艺术。关于性能方面,就像建筑设计成抗震9度需要...
ELK日志管理系统图示全
过程
详解
2019-09-09 11:33
羌俊恩的博客
目前已在
很多
大厂被应用落地,比如京东、美团、阿里,腾讯; 它由两个主要组件组成:prospectors 和 harvesters。这两个组件协同工作将文件变动发送到指定的输出
中
。 Prospector(勘测者): 负责管理Harvester并...
前端面试宝典(内容
很多
,也有
很多
重复)
2017-07-16 23:41
Night_Emperor的博客
一段脚本只能读取来自于
同一
来源的窗口和文档的属性,这里的
同一
来源指的是主机名、议和端口号的组合 19、编写一个数组去重的方法 function oSort(arr) { var result ={}; var newArr=[]; for...
没有解决我的问题,
去提问
向专家提问
向AI提问
付费问答(悬赏)服务下线公告
◇ 用户帮助中心
◇ 新手如何提问
◇ 奖惩公告