Java实现读取word的中文内容并存到mysql的blob字段中

时间: 2024-05-06 11:20:27 浏览: 9
实现步骤: 1. 引入相关的jar包,包括poi和mysql-connector-java。 2. 使用poi的HWPFDocument类读取word文档,获取文档的所有段落和表格。 3. 遍历每个段落和表格,获取其中的文本内容。 4. 将文本内容转换为字节数组,使用PreparedStatement将其存入mysql的blob字段中。 示例代码: ```java import java.io.FileInputStream; import java.io.InputStream; import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.util.List; import org.apache.poi.hwpf.HWPFDocument; import org.apache.poi.hwpf.usermodel.Paragraph; import org.apache.poi.hwpf.usermodel.Table; import org.apache.poi.hwpf.usermodel.TableCell; import org.apache.poi.hwpf.usermodel.TableRow; public class WordToMysql { public static void main(String[] args) { String filename = "test.doc"; //要读取的word文件名 String url = "jdbc:mysql://localhost:3306/test?useSSL=false&serverTimezone=UTC"; String username = "root"; String password = "123456"; String sql = "INSERT INTO word(content) VALUES(?)"; //要执行的SQL语句 try { Class.forName("com.mysql.cj.jdbc.Driver"); Connection conn = DriverManager.getConnection(url, username, password); PreparedStatement pstmt = conn.prepareStatement(sql); InputStream is = new FileInputStream(filename); HWPFDocument doc = new HWPFDocument(is); //遍历每个段落 List<Paragraph> paragraphs = doc.getParagraphs(); for (Paragraph para : paragraphs) { String text = para.text(); byte[] bytes = text.getBytes("UTF-8"); pstmt.setBytes(1, bytes); pstmt.executeUpdate(); } //遍历每个表格 int numTables = doc.getRange().numTables(); for (int i = 0; i < numTables; i++) { Table table = doc.getRange().getTable(i); int numRows = table.numRows(); for (int j = 0; j < numRows; j++) { TableRow row = table.getRow(j); int numCells = row.numCells(); for (int k = 0; k < numCells; k++) { TableCell cell = row.getCell(k); String text = cell.text(); byte[] bytes = text.getBytes("UTF-8"); pstmt.setBytes(1, bytes); pstmt.executeUpdate(); } } } pstmt.close(); conn.close(); is.close(); System.out.println("Done."); } catch (Exception e) { e.printStackTrace(); } } } ``` 注意事项: 1. 如果word文档中包含图片或其他非文本内容,可能无法正确读取。 2. 为了避免编码问题,建议将读取的文本内容转换为UTF-8编码的字节数组。

相关推荐

最新推荐

recommend-type

Java从数据库中读取Blob对象图片并显示的方法

主要介绍了Java从数据库中读取Blob对象图片并显示的方法,实例分析了Java读取数据库中Blob对象图片的技巧与操作方法,需要的朋友可以参考下
recommend-type

什么是blob,mysql blob大小配置介绍

BLOB (binary large object),二进制大对象,是一个可以存储二进制文件的容器。在计算机中,BLOB常常是数据库中用来存储二进制文件的字段类型
recommend-type

Java实现用Mysql存取图片操作实例

主要介绍了Java实现用Mysql存取图片操作实例,本文讲解了使用BLOB类型保存和读取图片的代码实例,需要的朋友可以参考下
recommend-type

javascript使用Blob对象实现的下载文件操作示例

本文实例讲述了javascript使用Blob对象实现的下载文件操作。分享给大家供大家参考,具体如下: Blob对象 前言 环境 操作 总结 Blob是一个类文件的不可变的原始数据对象,非javascript原生数据类型,File对象...
recommend-type

Java 类型相互转换byte[]类型,Blob类型详细介绍

主要介绍了Java 类型相互转换byte[]类型,Blob类型的相关资料,需要的朋友可以参考下
recommend-type

zigbee-cluster-library-specification

最新的zigbee-cluster-library-specification说明文档。
recommend-type

管理建模和仿真的文件

管理Boualem Benatallah引用此版本:布阿利姆·贝纳塔拉。管理建模和仿真。约瑟夫-傅立叶大学-格勒诺布尔第一大学,1996年。法语。NNT:电话:00345357HAL ID:电话:00345357https://theses.hal.science/tel-003453572008年12月9日提交HAL是一个多学科的开放存取档案馆,用于存放和传播科学研究论文,无论它们是否被公开。论文可以来自法国或国外的教学和研究机构,也可以来自公共或私人研究中心。L’archive ouverte pluridisciplinaire
recommend-type

实现实时数据湖架构:Kafka与Hive集成

![实现实时数据湖架构:Kafka与Hive集成](https://img-blog.csdnimg.cn/img_convert/10eb2e6972b3b6086286fc64c0b3ee41.jpeg) # 1. 实时数据湖架构概述** 实时数据湖是一种现代数据管理架构,它允许企业以低延迟的方式收集、存储和处理大量数据。与传统数据仓库不同,实时数据湖不依赖于预先定义的模式,而是采用灵活的架构,可以处理各种数据类型和格式。这种架构为企业提供了以下优势: - **实时洞察:**实时数据湖允许企业访问最新的数据,从而做出更明智的决策。 - **数据民主化:**实时数据湖使各种利益相关者都可
recommend-type

SQL怎么实现 数据透视表

SQL可以通过使用聚合函数和GROUP BY子句来实现数据透视表。 例如,假设有一个销售记录表,其中包含产品名称、销售日期、销售数量和销售额等信息。要创建一个按照产品名称、销售日期和销售额进行汇总的数据透视表,可以使用以下SQL语句: ``` SELECT ProductName, SaleDate, SUM(SaleQuantity) AS TotalQuantity, SUM(SaleAmount) AS TotalAmount FROM Sales GROUP BY ProductName, SaleDate; ``` 该语句将Sales表按照ProductName和SaleDat
recommend-type

JSBSim Reference Manual

JSBSim参考手册,其中包含JSBSim简介,JSBSim配置文件xml的编写语法,编程手册以及一些应用实例等。其中有部分内容还没有写完,估计有生之年很难看到完整版了,但是内容还是很有参考价值的。