python多线程爬虫如何在中断后继续上次的断点下载数据

比如某个网站有几十万页的数据，爬虫经常会遇到各个异常

不可能每次异常后，都重新从首页下载数据

那么如何在某次中断后，继续上次的断点继续下载？

我试过在mysql上新建一个表格，来实时记录每一页数据的状态，比如某页开始下载是0，没成功是NaN，页面没有数据是-1，成功是1，共4个状态

但mysql数据库，在多线程的情况下，频繁读取数据库，会有异常，同时也觉得不安全

请问大神，有什么好的方案解决吗

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
=XHG78999= 2021-06-04 21:35
关注
redis记没成功的不就完事了，带同步访问，doge

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

python多线程，断点续传下载程序
2013-03-05 20:37

python多线程，断点续传下载程序，功能比较简单，可以进行二次开发。实现更好用的功能。
python多线程文件的数据续传_python多线程爬取以及断点重下
2020-11-28 03:12

weixin_39777543的博客这是本人的第二篇文章在第一篇文章的基础上进行了内容的优化由于发现大量视频和图片下载难免遇见下载速度慢和时间久不能一直开着程序下载的问题于是乎增加两个功能让我们更加无忧无语的爬取想要的资源虽然urllib....
Python多线程爬虫加速电商数据采集
2025-09-20 14:44

深蓝电商API的博客本文介绍了一种基于Python多线程技术的电商数据采集方法，通过request库发送HTTP请求，结合BeautifulSoup解析页面内容。实现方案采用queue任务队列和threading多线程模块，显著提升了爬虫效率。文章提供了完整的代码...
Python3中的单线程带进度条和多线程下载文件代码及注意事项
2020-05-18 17:46

网上的一些代码可能会有些奇怪的问题，用的是类全局变量打开文件但在多线程中并未加锁，会导致文件有一定几率出现大小和源文件不同，即使文件大小相同,MD5值也不同,中间有一段是坏的，在图片和音频中可能只是其中一...
Python多线程高效爬虫项目-电影天堂资源爬取与数据解析-用于自动化批量下载电影信息海报磁力链接及字幕文件支持多线程并发处理与断点续传功能适用于影视资源归档数据分析及个.zip
2025-10-15 02:14

此外，该爬虫还具备断点续传功能，即在网络下载过程中如果出现中断，可以在下次启动时从上次中断的地方继续下载，这样保证了数据下载的完整性和稳定性。项目在设计时充分考虑了爬虫的效率和可用性，支持自动化批量...
如何让Python爬虫在遇到异常时继续运行
2024-07-18 10:47

亿牛云爬虫专家的博客在数据收集和数据挖掘中，爬虫技术是一项关键技能。然而，爬虫在运行过程中不可避免地会遇到各种异常情况，如网络超时、目标网站变化、数据格式不一致等。如果不加以处理，这些异常可能会导致爬虫程序中断，影响数据...
python爬虫-爬虫项目实战之知乎爬虫+断点续爬尝试.zip
2024-03-07 06:01

接下来，断点续爬是一个实用的功能，它使得在爬虫运行中断后可以从上次停止的地方继续，而不是重新开始。这通常涉及到两个方面：数据存储和状态记录。数据可以保存在本地文件、数据库或云存储中，状态记录则需要保存...
python知乎爬虫-断点续爬尝试
2024-06-24 09:21

这个标题暗示我们将讨论如何利用Python编写爬虫来抓取知乎网站上的信息，并且特别强调了断点续爬这一功能，这意味着我们的爬虫将具有在中断后从上次停止的地方继续爬取的能力，以应对网络不稳定或爬取任务过大等情况...
Python多线程高效爬虫项目_电影天堂资源爬取与数据解析_用于自动化批量下载电影信息海报磁力链接及字幕文件支持多线程并发处理与断点续传功能适用于影视资源归档数据分析及个.zip
2025-08-28 15:43

本项目中提到的“Python多线程高效爬虫项目”指的是一个利用Python语言编写的爬虫程序，该程序专注于电影资源网站“电影天堂”的数据抓取。项目的核心功能包括自动化批量下载电影信息、海报、磁力链接及字幕文件。 ...
Python实现多线程并发下载大文件（断点续传支持）
2021-08-22 00:23

小小明-代码实体的博客本文非常浅层的演示了python如何实现多线程文件下载，核心取决于现代服务器基本都支持范围下载的前提下。关于断点续传，文章已提供基本理论和实现思路，有兴趣通过python实现下载器的朋友都可以专门去实现一下。.......
没有解决我的问题, 去提问

python多线程爬虫如何在中断后继续上次的断点下载数据

3条回答 默认 最新

3条回答默认最新