爬取网站发现网站的数据量不对

标题其实描述的不准确，其实是我在试着爬取某文库，在写之前粗略计算了一下它包含的文档的量，发现就它明面上标出来的量不过12万左右，未免太少了。想知道剩下的量该怎么爬取？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-HGJ 2021-10-20 21:05
关注
有数据链接，有效请求才能获取数据，剩下的数据你也需要借助浏览器开发者工具去分析数据加载方式，参数传递要求等。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python 城市降雨量爬取(数据爬取).zip
2021-08-15 15:41

在这个“python城市降雨量爬取(数据爬取).zip”压缩包中，我们将探讨如何利用Python进行数据爬取，特别是针对城市降雨量这种实时、动态的数据。首先，我们需要了解Python中的几个关键库，它们在数据爬取中起着至关...
python爬取淘宝手机销售数据
2018-08-15 11:55

爬取淘宝手机月销售数据，以excel表格形式存储，以条形图形式展示不同品牌手机在淘宝的月销售量。可以通过更改关键字手机实现对其他商品的爬取。详细介绍...
python能爬取网站后台数据_如何利用Python爬取网站数据？
2020-12-03 02:45

weixin_39719018的博客 1.基本方法其实用python爬取网页很简单，只有简单的几句话这样就可以获得到页面的内容。接下来再用正则匹配去匹配所需要的内容就行了。但是，真正要做起来，就会有各种各样的细节问题。2.登录这是一个需要登录认证的...
python爬虫爬取网页数据并解析数据
2020-09-24 10:46

网络爬虫还可以帮助营销人员自动采集目标用户的联系方式，分析网站用户的活跃度、发言数、热门文章等信息，大大减少了手动收集数据的工作量和时间成本。在进行网络爬虫开发前，需要安装一些必要的第三方库，比如...
Python爬取天气分析可视化.zip
2022-01-14 17:04

在本项目"Python爬取天气分析可视化.zip"中，我们主要涉及了三个核心知识点：Python爬虫技术，数据分析，以及数据可视化。以下是对这些知识点的详细说明： 1. Python爬虫技术： Python爬虫是获取网络数据的一种...
Python分析51Job数据&源代码&爬取数据
2024-09-28 18:10

整个项目中，Python的源代码和爬取数据都是不可或缺的部分。源代码记录了整个数据爬取和分析的过程，是整个项目的执行脚本；而爬取的数据则是分析的基础，是项目产出结果的直接来源。在实际操作中，还需考虑到数据的...
使用python爬取招聘网站数据
2022-08-04 16:43

小白学大数据的博客八、九月份是一年中的求职高峰期，一大波应届毕业生涌入市场，加上疫情因素下，很多行业都没有那么景气，很多人应届生表示想要找到理想工作变得...在获取数据之前简单的对网站进行了分析，该网站上的反爬主要有两点
课程大作业基于Python爬取各省降水量数据及可视化分析源码+项目说明+超详细注释.tar
2023-11-16 22:44

- 由于降水量为动态数据，以js形式进行存储，故采用selenium方法经xpath爬取数据 ps：在进行数据爬取时，最初使用的方法是漂亮汤法（beautifulsoup）法，但当输出爬取的内容（时，却空空如也。在源代码界面Ctrl+...
各大网站新闻数据爬取.rar
2021-08-19 15:10

"各大网站新闻数据爬取.rar"这个压缩包文件显然包含了与爬虫和Python编程相关的资源，特别是针对光明网、人民网、腾讯和搜狐等知名网站的新闻数据爬取。首先，让我们深入了解Python爬虫。Python是一种高级编程语言...
Python爬取op.gg数据——英雄联盟版本强势英雄推荐
2021-01-20 02:15

通过爬取韩服op.gg网站的数据，推荐当前版本各路强势英雄（韩服比国服先更新）。目录通过爬取韩服op.gg网站的数据，推荐当前版本各路强势英雄（韩服比国服先更新）。一、op.gg源码及请求头分析二、源码分析三、数据...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 10月29日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 10月21日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月20日

爬取网站发现网站的数据量不对

1条回答 默认 最新

问题事件

1条回答默认最新