java从数据库读取百万级数据保存到text文件中，速度慢，怎么解决

代码如下，做一个数据脚本的备份与还原，从数据库查询所有记录，拼接成插入语句，数据库中有600多万条数据，在自的电脑上试，写到txt文件中足足花了半个小时的时间啊。。。。。不知道哪里有问题，麻烦各位指点一下
[code="java"]

/**
* 如果记录大于10000行，则分页抓取，每次抓取10000条,这里只适应于在mysql
* @param rowCount
* 总记录数
* @param table
* 表名
* @param writer
* 输入流
*/
private static BufferedWriter fetchByPage(int rowCount, String table,
BufferedWriter writer) {
final int fetchSize = 10000;
final int pageSize = rowCount % fetchSize == 0 ? rowCount / fetchSize
: rowCount / fetchSize + 1;
int currentPage = 1;
Connection conn = null;
Statement stsm = null;
ResultSet rs = null;
try {
conn = newConnection();
conn.setAutoCommit(false);
stsm = conn.createStatement();
if (isSqlServer(conn)) {
writer
.write("SET IDENTITY_INSERT [dbo].[" + table
+ "] ON; \n");
} else {
writer.write("SET FOREIGN_KEY_CHECKS=0;\n"); // 默认是mysql
}
while (currentPage <= pageSize) {
String sql = "select * from " + table + " limit "
+ (currentPage - 1) * fetchSize + "," + fetchSize;
rs = stsm.executeQuery(sql);
writeByRow(conn, table, rs, writer);
currentPage++;

        }
        if (isSqlServer(conn)) {
            writer.write("SET IDENTITY_INSERT [dbo].[" + table
                    + "] OFF; \n");
        }

    } catch (Exception e) {
        e.printStackTrace();
    } finally {
        if (conn != null) {
            try {
                if (!conn.isClosed())
                    conn.close();
                if (stsm != null)
                    stsm.close();
                if (rs != null)
                    rs.close();
            } catch (SQLException e) {
                e.printStackTrace();
            }
        }
    }
    return writer;

}

private static BufferedWriter writeByRow(Connection conn, String tableName,
ResultSet rs, BufferedWriter writer) throws Exception {
while (rs.next()) {
StringBuilder insertSql = new StringBuilder();
insertSql.append("insert into ");
String[] columnNames = getColumnNames(rs);
if (isSqlServer(conn)) {
insertSql.append("" + tableName + ";
for (String columnName : columnNames) {
insertSql.append("[" + columnName + "],");
}
} else {
insertSql.append("" + tableName + "(");
for (String columnName : columnNames) {
insertSql.append("" + columnName + ",");
}
}
insertSql.deleteCharAt(insertSql.length() - 1);
insertSql.append(")");
insertSql.append(" values(");
for (int i = 0; i < columnNames.length; i++) {
String columnClassName = rs.getMetaData().getColumnClassName(
i + 1);
if (rs.getObject(i + 1) != null) {

                if (columnClassName.equalsIgnoreCase("java.lang.String")) {
                    String strValue = rs.getString(columnNames[i]);

                    strValue = strValue.replaceAll("\r", "\\\\r");
                    strValue = strValue.replaceAll("\n", "\\\\n");
                    insertSql.append("'" + strValue + "',");
                } else {
                    insertSql.append("'" + rs.getObject(i + 1) + "',");
                }
            } else {
                insertSql.append(rs.getObject(i + 1) + ",");
            }
        }
        int index = insertSql.toString().lastIndexOf(",");
        String sqlText = insertSql.toString().substring(0, index) + ")";

        writer.write(sqlText + ";\n");
    }

    return writer;
}

[/code]

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

7条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
yunzhu666 2013-04-19 21:52
关注
这种方式确实本身就有问题，性能不会很高，像MySQL本身就有备份还原数据库的命令：
%MYSQL_HOME%\bin>mysqldump -uroot -proot DB_NAME > "D:/DB_NAME_BAK.sql"

当然这种方式一次性导出，针对大数据量可能确实不行。

[color=red]LZ现在的方式，首当其冲的问题就是：每从数据库查询一条数据就生成SQL并写到文件中。[/color]
[b]程序效率低的原因分析：[/b]
这必然导致效率极低，因为数据库查询时的阻塞会导致整个任务暂停，这时既不生成SQL也不写文件；写文件时的阻塞也会导致整个任务暂停，这时也不再查询数据库了。这样当然效率很低了，因为这两种阻塞不断发生，导致整个任务很大一部分时间啥也没干，CPU闲置。

[b]一、初步优化的方案：[/b]
“数据库查询的操作”和“生成SQL并写文件”分开来，用两个线程去做：

一个线程从数据库查询数据并简单处理（比如把每条数据放在一个map中，甚至放在一个数组中，这样速度更快，但是要在程序中控制，要清楚数组中每个元素是什么值），然后将简单处理后的数据放到一个队列中。

另一个线程负责从队列中读取简单处理过的数据，生成SQL，然后写入到文件中。

[color=red]注意点：进行这一步优化后，那个队列需要重点实现，应该是线程安全的，因为两个线程都要访问。典型的消费者模式。[/color]

[b]二、进一步的优化方案：[/b]
按照方案一优化后，效率有所提升，但还是达不到所需的性能要求，那么进一步进行优化。方案一中，最大的性能瓶颈可能是访问数据库的那个线程，可以考虑用多个线程并发访问数据库，但是这个线程也不能太多，太多也会慢，要通过具体实践取各平衡点。

[color=red]注意点：这里要注意几个并发访问数据库的线程的分工，比如每个线程各负责某个时间段的数据，得有一个总线程负责调度。[/color]

[b]三、再一步的优化方案：[/b]
按照方案二优化后，还可以在一个地方优化，哪里呢？那就是除了访问数据库之外的另一个可能阻塞的地方——写文件。这里也可以考虑多线程并发，但是不要多个线程写一个文件，可以每个线程写一个文件，最后把多各文件进行汇总，就得到了最终的数据库备份脚本。

另外有一个方案是——每个访问数据库的线程对应一个生成SQL并写文件的线程，然后一个总线程，总线程负责给每个问数据库的线程分配任务，最后把所有SQL文件汇总成最终结果。

LZ先按照第一个方案优化下，这个是必须的。不满足再进行后续优化。
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(6条)

报告相同问题？

关注问题

JDBC连接数据库读取前台无法显示数据 java 前端数据库
2022-07-20 21:44

回答 9 已采纳试试：1、在jdbc_url中，加上 useSSL=false&useUnicode=true&characterEncoding=UTF-8&serverTimezone=UTC2、将驱动类改成：c
Java如何读取文件文本并且对数据内容进行比较 java 有问必答
2021-06-11 21:22

回答 3 已采纳定义学生对象，读取文件内容时，写入对象中，最后是一个对象集合。然后对对象集合中每个学生对象进行判断。
使用servlet向数据库中添加数据 java java-ee tomcat
2022-06-10 12:35

回答 3 已采纳 https://blog.csdn.net/linshenshijianlu/article/details/76359294?ops_request_misc=%257B%2522request%2
java从mysql中读取大量数据_java从数据库读取百万级数据保存到text文件中，速度慢，怎么解决...
2021-01-19 21:14

凡然爸爸的博客代码如下，做一个数据脚本的备份与还原，从数据库查询所有记录，拼接成插入语句，数据库中有600多万条数据，在自的电脑上试，写到txt文件中足足花了半个小时的时间啊。。。。。不知道哪里有问题，麻烦各位指点一下/*...
java jtree实现QQ好友列表，读取到了数据库图片显示不出来 java 有问必答
2021-09-03 19:05

回答 2 已采纳 headimage看下这个参数是否为null.
jsp页面提交后如何将信息传到另一个jsp页面并将数据存储到数据库 java 数据库
2018-05-13 07:41

回答 8 已采纳一般如果是提交到Controller中都是直接封装成实体类，你说的提交到另外一个页面，这里我们可以采用一种比较古典的方法你的提交页面的需要提交的字段需要设置name属性，然后在form表单中设置为
用flinkcdc读取mysql数据,写入postgresql数据库,程序运行一段时间后挂了 flink
2022-11-11 14:34

回答 1 已采纳我觉得你可能日志定位错了，看逻辑应该只有去重算子有状态会造成CK超时状态过大崩溃重启，重启之后逻辑就类似你这个日志
java获取数据库数据保存到本地txt文件中
2021-11-01 15:31

怪只怪满眼尽是人间烟火的博客 } } 最后是配置文件application.properties dir=D:\\aaa.txt spring.datasource.primary.jdbc-url=jdbc:mysql://192.168.xx:xx/xx spring.datasource.primary.username=xx spring.datasource.primary.password=xx ...
JSP遍历数据库中的数据遇到500的报错 eclipse java
2021-06-05 18:05

回答 1 已采纳看上去好像是你使用了不存在的标签, <c:forEach> 你将这段先注释掉排查一下具体是哪个地方的错误如果是jstl 标签库的问题的话你可能需要排查一下你相关的配置是
ECharts怎么获取数据库数据？ echarts java 前端
2023-03-24 17:01

回答 2 已采纳打开echarts官网实例，左边代码对比右边预览效果（可修改），按照你要赋值的数据替换成变量链接 https://echarts.apache.org/examples/zh/editor.html?
在springboot项目资源目录新建txt文件,来写入数据库查询的数据,本人小白,求详细点代码,谢谢！ eclipse java java-ee
2019-03-11 17:36

回答 2 已采纳 数据库查询代码也需要写，还是已经将数据库的内容查询到内存中？回复：难点一：获取项目的资源路径；难点二：文件流的操作； ``` package com.qianqiangon
java将mysql数据写入到txt_java如何从数据库读取数据并写入txt文件？
2021-01-19 08:07

糖飘人间的博客展开全部写Java程序时经常碰到要读如txt或写入txt文件的情况，但是由于要定义好多变量，经常记不住，每e69da5e6ba9062616964757a686964616f31333365643562次都要查，特此整理一下，简单易用，方便好懂！[java]...
使用java从MySQL数据库中读取数据（一个简单的java web实现）
2021-03-10 14:03

脸是真的白的博客零基础开发 javaWeb 一、实验目的及要求使用java语言从MySQL数据库中查询其中一个表的数据。二、实验环境 Windows 10环境 java version： 11.0.10 IDE工具：IntelliJ IDEA 2020.3 MySQL: 5.7.26
JAVA从文本文件(txt)读取一百万条数据保存到数据库
2019-11-07 10:05

听闻余生的旋律的博客 Java读取大文本文件保存到数据库 1、追求效率　将文件读取到内存，效率比较高，经过测试读取1G左右的文本文件，机器内存消耗达到接近3个G，对内存消耗太大，不建议使用 2、通过调用第三方类库实现　通过开源的...
Java读取csv文件，批量写入数据库
2023-07-27 17:42

Gurucyy的博客功能说明：该Java类名为RyTask，是一个定时任务...它的主要功能是从指定路径的压缩文件中解压出CSV数据，并将解析后的数据使用多线程的方式进行批量插入到数据库中。前提说明：涉及隐私问题，部分引入依赖包已删除。
没有解决我的问题, 去提问

悬赏问题

¥60 请查询全国几个煤炭大省近十年的煤炭铁路及公路的货物周转量
¥15 请帮我看看我这道c语言题到底漏了哪种情况吧！
¥66 如何制作支付宝扫码跳转到发红包界面
¥15 pnpm 下载element-plus
¥15 解决编写PyDracula时遇到的问题
¥15 有没有人能解决下这个问题吗，本人不会编程
¥15 plotBAPC画图出错
¥30 关于#opencv#的问题：使用大疆无人机拍摄水稻田间图像，拼接成tif图片，用什么方法可以识别并框选出水稻作物行
¥15 Python卡尔曼滤波融合
¥20 iOS绕地区网络检测

java从数据库读取百万级数据保存到text文件中，速度慢，怎么解决

7条回答 默认 最新

悬赏问题

7条回答默认最新