java 多线程数据库插入千万级数据

时间: 2023-10-03 15:09:17 浏览: 46
在 Java 中实现多线程数据库插入千万级数据,可以采用线程池的方式来实现。 首先,创建一个线程池,然后将数据分割成若干个数据块,每个线程处理一个数据块,将数据插入到数据库中。在插入数据时,可以采用批处理的方式,将多条数据一次性插入到数据库中,以提高效率。 下面是一个简单的示例代码,用于实现多线程数据库插入千万级数据: ```java import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.SQLException; import java.util.ArrayList; import java.util.List; import java.util.concurrent.ExecutorService; import java.util.concurrent.Executors; public class MultiThreadInsert { private static final String url = "jdbc:mysql://localhost:3306/test?useSSL=false&serverTimezone=UTC"; private static final String user = "root"; private static final String password = "root"; public static void main(String[] args) { int threadNum = 10; // 线程数 int dataSize = 10000000; // 数据量 int batchSize = 1000; // 批处理大小 // 数据块大小 int blockSize = dataSize / threadNum; if (blockSize % batchSize != 0) { blockSize = (blockSize / batchSize + 1) * batchSize; } // 生成数据 List<List<String>> dataList = generateData(dataSize); // 线程池 ExecutorService executor = Executors.newFixedThreadPool(threadNum); // 数据库连接 Connection conn = null; try { conn = DriverManager.getConnection(url, user, password); // 插入数据 for (int i = 0; i < threadNum; i++) { int start = i * blockSize; int end = start + blockSize; if (end > dataSize) { end = dataSize; } List<List<String>> subList = dataList.subList(start, end); executor.execute(new InsertTask(subList, conn, batchSize)); } // 关闭线程池 executor.shutdown(); while (!executor.isTerminated()) { Thread.sleep(100); } System.out.println("数据插入完成!"); } catch (SQLException | InterruptedException e) { e.printStackTrace(); } finally { if (conn != null) { try { conn.close(); } catch (SQLException e) { e.printStackTrace(); } } } } // 生成数据 private static List<List<String>> generateData(int dataSize) { List<List<String>> dataList = new ArrayList<>(); for (int i = 0; i < dataSize; i++) { List<String> row = new ArrayList<>(); row.add("value1"); row.add("value2"); row.add("value3"); dataList.add(row); } return dataList; } } // 插入数据任务 class InsertTask implements Runnable { private List<List<String>> dataList; private Connection conn; private int batchSize; public InsertTask(List<List<String>> dataList, Connection conn, int batchSize) { this.dataList = dataList; this.conn = conn; this.batchSize = batchSize; } @Override public void run() { try { String sql = "INSERT INTO test_table (column1, column2, column3) VALUES (?, ?, ?)"; PreparedStatement ps = conn.prepareStatement(sql); int count = 0; for (List<String> row : dataList) { ps.setString(1, row.get(0)); ps.setString(2, row.get(1)); ps.setString(3, row.get(2)); ps.addBatch(); count++; if (count % batchSize == 0) { ps.executeBatch(); count = 0; } } if (count > 0) { ps.executeBatch(); } ps.close(); } catch (SQLException e) { e.printStackTrace(); } } } ``` 在上面的示例代码中,我们使用了线程池来创建多个线程,将数据分割成若干个数据块,每个线程处理一个数据块,将数据插入到数据库中。同时,我们还使用了批处理的方式,将多条数据一次性插入到数据库中,以提高效率。

相关推荐

最新推荐

recommend-type

java多线程编程之从线程返回数据的两种方法

从线程中返回数据和向线程传递数据类似。也可以通过类成员以及回调函数来返回数据。但类成员在返回数据和传递数据时有一些区别,下面让我们来看看它们区别在哪
recommend-type

Python爬虫进阶之多线程爬取数据并保存到数据库

今天刚看完崔大佬的《python3网络爬虫开发实战》,顿时觉得...为了避免这种尴尬,以及我突然想写博客的心情,我决定还是为大家在进行一次简易爬虫展示,总体程序我会利用多线程的方式来充分利用CPU的空闲时间,其中我也
recommend-type

Java多线程之多线程异常捕捉

在java多线程程序中,所有线程都不允许抛出未捕获的checked exception,也就是说各个线程需要自己把自己的checked exception处理掉,通过此篇文章给大家分享Java多线程之多线程异常捕捉,需要的朋友可以参考下
recommend-type

java多线程编程之向线程传递数据的三种方法

在多线程的异步开发模式下,数据的传递和返回和同步开发模式有很大的区别。由于线程的运行和结束是不可预料的,因此,在传递和返回数据时就无法象函数一样通过函数参数和return语句来返回数据
recommend-type

java使用CountDownLatch等待多线程全部执行完成

主要为大家详细介绍了使用CountDownLatch等待多线程全部执行完成,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
recommend-type

zigbee-cluster-library-specification

最新的zigbee-cluster-library-specification说明文档。
recommend-type

管理建模和仿真的文件

管理Boualem Benatallah引用此版本:布阿利姆·贝纳塔拉。管理建模和仿真。约瑟夫-傅立叶大学-格勒诺布尔第一大学,1996年。法语。NNT:电话:00345357HAL ID:电话:00345357https://theses.hal.science/tel-003453572008年12月9日提交HAL是一个多学科的开放存取档案馆,用于存放和传播科学研究论文,无论它们是否被公开。论文可以来自法国或国外的教学和研究机构,也可以来自公共或私人研究中心。L’archive ouverte pluridisciplinaire
recommend-type

实现实时数据湖架构:Kafka与Hive集成

![实现实时数据湖架构:Kafka与Hive集成](https://img-blog.csdnimg.cn/img_convert/10eb2e6972b3b6086286fc64c0b3ee41.jpeg) # 1. 实时数据湖架构概述** 实时数据湖是一种现代数据管理架构,它允许企业以低延迟的方式收集、存储和处理大量数据。与传统数据仓库不同,实时数据湖不依赖于预先定义的模式,而是采用灵活的架构,可以处理各种数据类型和格式。这种架构为企业提供了以下优势: - **实时洞察:**实时数据湖允许企业访问最新的数据,从而做出更明智的决策。 - **数据民主化:**实时数据湖使各种利益相关者都可
recommend-type

机器学习怎么将excel转为csv文件

机器学习是一种利用计算机算法和统计数据的方法来训练计算机来进行自动学习的科学,无法直接将excel文件转为csv文件。但是可以使用Python编程语言来读取Excel文件内容并将其保存为CSV文件。您可以使用Pandas库来读取Excel文件,并使用to_csv()函数将其保存为CSV格式。以下是代码示例: ```python import pandas as pd # 读取 Excel 文件 excel_data = pd.read_excel('example.xlsx') # 将数据保存为 CSV 文件 excel_data.to_csv('example.csv', index=
recommend-type

JSBSim Reference Manual

JSBSim参考手册,其中包含JSBSim简介,JSBSim配置文件xml的编写语法,编程手册以及一些应用实例等。其中有部分内容还没有写完,估计有生之年很难看到完整版了,但是内容还是很有参考价值的。