多线程读取数据库

我的需求很简单，我想从数据库读出url网页地址，读取过的不能再读，然后抓取网页源码，抓取完然后再存回去，url记录大约有十万

条，请问各位高手，我应该怎么样做呢？我的思路是开一个线程，读过的再把它一个字段如isReaded修改为1，再开几个线程去抓取。但问

题是：怎么样读取数据好呢，不能一下就读十万吧。读出来数据怎么放让另外的线程去读的？刚才试了下，一边读一边更新isReaded字

段，读取3000条时就报Network error IOException: Address already in use: connect 异常，也不知道是什么原因。还有怎么样才能做

到多线程插入数据
[b]问题补充：[/b]
谢谢两位的回答，还有几个疑问

to ranLoD: "一个标识对象，当入库的线程读取到标识对象的时候线程结束" 一个标识对象是什么意思，怎么样读取标识对象，能否写出几句简单的代码

to pwg17:"读取的线程读一批URL出来后，更新这批URL"，怎么样做到呢，怎么控制数量，怎么更新呢，能否写出几句简单的代码
[b]问题补充：[/b]
因为还有程序不断往数据库里插入新数据，一开始读完十万可以，但还是有一个线程定时扫描数据吧？
[b]问题补充：[/b]
谢谢pwg17的一直回答。是的，是写一个爬虫。因为分析抓取时，是用别的语言写的，不保存在数据库里没法进行交互啊
[b]问题补充：[/b]
是的，我只是负责下载页面，其他分析不是我管。这几天看别人用C#写一个多线程抓取，感觉运行起来比Java快，C#有个HttpWebRequest组件封装挺好的，感觉比java的好用，不知是否理解正确。我也打算用hibernate试试，不知道多线程下hibernate有没有要注意的问题。分有点少，我是新人，多多理解啊。也谢谢各位的回答。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

6条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
iteye_20452 2009-07-09 12:19
关注
嗯，我就是用C#的，HttpWebRequest是挺方便的。没有哪个语言写就快，看些代码的人而已。想快速的话，程序用多线程，然后再弄成分布式。感觉你们蜘蛛这里拆分成不同部分不同人负责，想快速的话，只能是看整体实现的怎样了。hibernate不是很熟悉，在蜘蛛这里用不是很适合，个人感觉，或者用Ibatis吧。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(5条)

报告相同问题？

关注问题

多线程读取数据库
2021-08-29 17:41

Never Know 1的博客连接数据库 package com.xinyuan.ms.service; import java.sql.*; import java.util.*; public class ThreadToMysql extends Thread { Integer cid; Integer num; // Integer page; public ThreadToMysql...
python多线程读取数据库数据_python使用多线程查询数据库的实现示例
2020-11-28 03:12

weixin_39983383的博客背景：当数据量过大时，一个程序的执行时间就会主要花费在等待单次查询返回结果，在这个过程中cpu无疑是处于等待io的空闲状态的，这样既浪费了cpu资源，又花费了大量时间（当然这里主要说多线程，批量查询不在考虑...
python多线程读取数据库数据_python多线程操作MySQL数据库pymysql
2020-11-28 03:12

weixin_39640909的博客 python多线程操作MySQL数据库pymysql项目中使用多线程操作数据库提示错误：pymysql.err.InterfaceError: (0, ”)，原因是pymysql的execute有独占锁机制，解决办法是每个线程单独一个数据库连接，为线程增加一个...
易语言-多线程同时查询同一数据库对比
2021-06-29 16:16

在本案例中，我们关注的是"易语言-多线程同时查询同一数据库对比"，这涉及到如何在易语言中利用多线程来并发地查询数据库，并与单线程查询进行比较。易语言是一种面向对象的、以中文编程为特色的编程语言，其目标...
易语言多线程同时查询同一数据库
2020-07-20 15:52

综上所述，易语言多线程同时查询同一数据库的技术实现涉及到多线程编程原理、数据库访问控制、事务管理、查询优化、错误处理和线程通信等多个知识点。通过熟练掌握这些技术，开发者可以构建出高效且稳定的数据库查询...
Java多线程读取大文件
2020-12-22 21:24

【Java多线程读取大文件】是一种优化的文件处理策略，特别适用于处理大型文本文件。在传统的单线程I/O操作中，读取大文件可能导致内存溢出（OOM），尤其是在尝试一次性加载整个文件到内存时。为了避免这个问题，我们...
Qt多线程与数据库
2024-09-29 23:45

伸头看云朵的博客那么可以用多线程，在子线程中查询数据，主线程可以弹出一个模态窗口进行提示，如“数据载入中”。如果希望在子线程中完成对数据库的查询操作，那么在子线程中重新添加一个新的连接名。之前上个项目用的方法是分页...
Qt多线程连接数据库
2023-05-30 17:28

十年编程老舅的博客 Qt多线程连接数据库
易语言多线程数据库查询对比源码-易语言
2021-06-13 11:32

在本压缩包中，"易语言多线程数据库查询对比源码"是一个示例项目，旨在教授如何在易语言中实现多线程查询数据库的技术，并通过对比不同查询方式来展示性能差异。首先，我们要理解多线程的概念。在计算机科学中，...
Qt数据库利用线程读取MySql数据
2014-11-18 22:14

总结起来，利用Qt5的QThread和QSql模块，我们可以在VS2010中实现一个后台线程读取MySQL数据库，避免阻塞UI，从而提供更流畅的用户体验。同时，`ThreadDialog`文件则可能封装了这个过程，为用户提供一个交互式的查询...
没有解决我的问题, 去提问

多线程读取数据库

6条回答 默认 最新

6条回答默认最新