如何节省请求次数，提高爬取效率

我有个需求就是爬取一个接口的数据，此接口只接收一个参数ID，此ID的规则如下

202102271024384610

我分隔说下含义

2021年02月27日10点24分38秒 + 4610申请人身份证后四位

我也研究过身份证后四位的编码规则，基本就是10*10*10*11种组合

前面时间的话是一天24*60*60种组合，按实际情况去掉凌晨的8个小时，实际一天也就200-300条数据

我要在16*60*60*10*10*10*11里找这200-300条数据，如何能提高成功率呢？是不是只能穷举了.....

prefix = '2021031720'
for minute in range(0, 1):
    for second in range(0, 60):
        for no in range(0, 100):
            for last in range(0, 11):
                if last == 10:
                    last = 'X'
                indexId = prefix + str(minute).zfill(2) + str(second).zfill(2) + str(no).zfill(3) + str(last)
                login_data = {'indexId': indexId}
                r = s.post('http://xx.com', login_data)
                result = json.loads(r.text)
                print("正在抓取："+indexId)
                if (result.get('status') == 0):
                    print("抓到一个："+indexId)

补充下背景：

1.男女性比例差不太多，身份证奇偶位算一样概率

2.地区主要是冀鲁豫地区、年龄主要是22-40岁

3.申请时间主要是白天，晚上居多，凌晨几乎没有

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN技术专家团—wangjie 2021-03-22 13:44
关注
目标的200-300条数据本身有什么规律或者特征吗？比如男性较多、女性较多？之类的。还是完全随机的。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

Python使用xpath实现图片爬取
2020-09-17 11:24

使用`Pool(10)`创建一个包含10个工作线程的线程池，通过`pool1.map()`并行处理每个页面的图片下载任务，提高爬取效率。异步爬虫的目的是提升爬取速度，避免阻塞。在上述代码中，虽然没有直接实现异步处理，但是...
Python爬取十篇新闻统计TF-IDF
2020-09-20 22:21

【Python爬取TF-IDF】在信息技术领域，TF-IDF（Term Frequency-Inverse Document Frequency）是一种常用的文本处理技术，用于衡量一个词汇在文档集合中的重要性。TF-IDF值结合了词频（Term Frequency, TF）和逆文档...
python百度翻译爬取调用代码.zip
2023-09-11 21:21

在Python编程领域，百度翻译API是一个非常实用的工具，它允许开发者通过编程方式实现自动翻译功能，极大地提高了语言处理的效率。"python百度翻译爬取调用代码.zip"这个压缩包文件显然包含了实现这一功能的代码示例...
Python 爬取大量数据如何并发抓取与性能优化
2024-11-06 13:55

chusheng1840的博客在抓取任务中，合理选择并发方式（如多线程、多进程或异步 IO），并结合性能优化策略（如限速、重试、代理池和缓存）可以显著提高爬虫的效率。通过合理配置和性能优化，即使在高并发抓取需求下，也可以有效降低资源...
Python 爬虫实战：多线程爬虫提升爬取效率
2025-12-18 16:22

python 爬虫工程师的博客本文深入解析Python多线程爬虫技术，通过豆瓣电影Top250案例对比单线程与多线程爬取效率。单线程耗时约18.76秒，而采用ThreadPoolExecutor实现的5线程方案仅需4.89秒，效率提升284%。文章详细讲解线程池创建、任务...
Python爬虫-爬取京东商品详情页面数据
2025-10-16 09:22

Datafox（数据狐）的博客京东商品详情API提供实时商品数据...Python示例代码展示了签名生成、请求构造和异常处理，建议通过缓存策略和批量查询优化性能。该API适用于价格监控、竞品分析等电商场景，数据延迟≤30秒，具有企业级并发支持能力。
[python练习实例源码]批量爬取B站小视频.zip
2023-08-27 02:34

7. **多线程或异步处理**：为了提高爬取效率，可以使用Python的`concurrent.futures`模块进行多线程或异步请求。这样，程序可以同时处理多个视频的爬取，显著减少总耗时。 8. **遵守网络爬虫伦理**：在进行网络爬取...
Python爬虫(小说爬取)
2025-05-12 17:47

夜思红尘的博客本文介绍了如何使用Python编写爬虫程序来爬取小说网站中的小说内容。首先，需要安装requests和bs4模块，用于发送HTTP请求和解析HTML内容。接着，通过分析目标网页的URL和HTML结构，使用BeautifulSoup库提取小说正文...
使用 Python 爬取天气数据并保存至 CSV
2024-04-19 10:35

清河大善人的博客性能优化：代码中存在大量的嵌套循环，可能导致性能较差，可以考虑优化算法，减少循环次数，提高程序执行效率。数据清洗：爬取的数据可能存在错误或不完整，需要进行数据清洗和验证，以确保数据的准确性和完整性。...
用python实现的爬取小说网站资源的爬虫毕业设计基于lxml和requests
2023-01-11 03:21

每个线程独立执行爬虫任务，同时管理一组请求，以避免因单一线程而限制爬取效率。然而，需要注意的是，过多的并发请求可能会引起目标网站的反爬策略，因此需要合理设置线程数量。自动调用功能使得这个爬虫可以持续...
没有解决我的问题, 去提问

如何节省请求次数，提高爬取效率

3条回答 默认 最新

3条回答默认最新