如何解决爬取网站不定时不返回数据

初学爬虫，遇到了棘手问题。
爬某网站采购公告信息，关键词搜索出来有5页100条，每一条里对应一个链接页面有详细信息。
现在是，我可以取到1-3页或1-4页数据，看情况不等，有时候第1页就不行。
也就是说我xpath解析没毛病，网页请求也是对的。
查了网上，有的说删除heads，我试了一样；每页之间我试着time.sleep几秒，也不行。
头大，求指教。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

12条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
梦想橡皮擦优质创作者: python技术领域 2023-01-28 15:53
关注
额，看我的专栏呀，专业对口

https://blog.csdn.net/hihell/category_9280209.html

需要看具体站点，可以给我发

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

利用java定时爬取网页数据
2020-11-11 10:56

在IT行业中，Java是一种广泛应用的编程语言，尤其在构建企业级应用和自动化任务方面表现出色。本主题聚焦于“利用Java定时爬取网页数据”，这是一个典型的数据抓取和任务调度的场景，对于数据分析、信息监控或者网站...
运用tushare爬取五档盘口实时数据
2023-03-21 19:21

本文将详细介绍如何使用Python编程语言和tushare库来爬取五档盘口的实时数据。首先，tushare是一个专业的Python财经数据接口库，提供了丰富的中国金融市场的数据，包括股票、期货、期权、基金等。它提供了简洁易用...
基于java爬取股票数据的一个项目.zip
2024-03-24 10:50

该项目是使用Java编程语言实现的股票数据爬取系统，旨在从网络上抓取实时或历史的股票市场数据。以下是对这个项目中可能涉及的关键技术、概念和知识点的详细解释： 1. **网络爬虫（Web Crawler）**：网络爬虫是自动...
Python爬虫开发实战，爬取电商网站商品信息，案例教程编程实例课程详解
2024-07-04 08:14

好知识传播者的博客在开始编写爬虫之前，我们需要明确爬取的目标电商网站、所需商品的分类、具体要获取的商品信息字段（如商品名称、价格、图片链接、描述等）以及爬取数据的频率和规模。2.风险评估：评估项目可能面临的风险，如法律...
利用python数据爬取技术，爬取智联招聘网站上，不同城市地区的近期招聘信息.zip
2024-04-24 16:34

Python是一种强大的编程语言，尤其在数据处理和网络爬虫领域有着广泛的应用。在这个项目中，我们探讨了如何利用Python来爬取智联招聘网站上的招聘信息，以便获取不同城市地区的最新职位信息。智联招聘是中国领先的...
搜索引擎爬虫开发：如何实现定时爬取任务
2025-05-15 23:49

程序员光剑的博客随着互联网数据爆炸式增长，搜索引擎需要高效的定时爬取机制来持续更新索引库。定时爬取的核心技术原理（时间调度算法、任务队列模型）单机及分布式环境下的工程实现方案反爬机制与增量爬取策略的集成大规模爬虫系统...
有哪些网站用爬虫爬取能得到很有价值的数据？
2019-05-05 17:47

BC_COM的博客回顾2016年，我用爬虫做了很多事情。 1、微信好友的爬虫，了解一下你的好友全国分布，...2、拉勾网的数据那么多的招聘信息有用吗？当然有用，你想了解一下你所在城市的各种主流语言（Java、PHP、JavaScript、Pytho...
爬虫爬出来的数据不全_Python爬虫，你是否真的了解它？
2020-12-01 09:33

weixin_39553904的博客 </p><h3>4、JavaScript脚本动态获取网站数据</h3><p>有一些网站（尤其是单页面网站）的内容并不是通过服务器直接返回的，而是服务器只返回一个客户端JavaScript程序，然后JavaScript获取内容。更高级的是，...
提供国内财经门户网站股票相关数据目前有新浪和凤凰网的数据
2019-08-08 14:59

标签“PHP开发-HTTP和网站爬取”暗示了我们需要使用PHP编程语言，结合HTTP协议和网页抓取技术来实现数据获取。PHP是一种服务器端脚本语言，常用于网页开发，也适用于构建数据抓取工具。HTTP（超文本传输协议）是...
如何高效爬取亚马逊产品数据：小白实战指南
2025-02-13 17:52

SNN_Ryan的博客亚马逊作为全球电商巨头，其海量的产品数据提供了丰富的市场情报。当你通过代理IP发送请求时，亚马逊看到的...然而，要获取这些数据，爬虫技术是不可或缺的工具，但要成功爬取亚马逊数据，代理IP的使用同样至关重要。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 2月5日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月28日

如何解决爬取网站不定时不返回数据

12条回答 默认 最新

问题事件

12条回答默认最新