d?fileid=aaa9aee4717d33272bd7ea028fa03118b693919f23b18febf9f6cee1158e8f4cf027542c71c8cf98d63770ccdf3bd1750e6b92e28c43dccd4" /></p><div class="ckeditor-html5-video" data-widget="html5video" style="text-align:left"><video controls="controls" src="/weaver/weaver.file.FileDownload?fileid=aad6f413f83191673980c5ee24b412880d6b9e8703caca411faec3276fe8133f5fa7e34630ca89ace63770ccdf3bd175071362141037cfb4e&download=1" style="max-width:100%"> </video></div><table border="1" cellpadding="1" style="width:500px;"> <tbody> <tr> <td style="padding: 1px;">1</td> <td style="padding: 1px;">1</td> </tr> <tr> <td style="padding: 1px;">2</td> <td style="padding: 1px;">2</td> </tr> <tr> <td style="padding: 1px;">3</td> <td style="padding: 1px;">3<a href="http://localhost:8080/wui/index.html#/main/portal/portal-1-1?menuIds=0,1&menuPathIds=0,1&_key=zq8830" target="_blank">http://localhost:8080/wui/index.html#/main/portal/portal-1-1?menuIds=0,1&menuPathIds=0,1&_key=zq8830</a></td> </tr> </tbody></table><p>测试<a href="http://localhost:8080/wui/index.html#/main/portal/portal-1-1?menuIds=0,1&menuPathIds=0,1&_key=zq8830" target="_blank">http://localhost:8080/wui/index.html#/main/portal/portal-1-1?menuIds=0,1&menuPathIds=0,1&_key=zq8830</a></p><p> </p><p>修改一下吧 qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq<img alt="" src="/weaver/weaver.file.FileDownload?fileid=a7617945ec5f52ec80aaa43ee8504de0a1b14d5eca4a98834494c85349762c626dec7ba8d0da277106ee600d27743f4e44f710fbddd167603" /></p></div> Java获取文本中文字内容,不要图片,视频等
时间: 2024-01-03 14:41:13 浏览: 23
您可以使用Java正则表达式来获取文本中的中文内容,同时忽略图片、视频等非中文内容。以下是一个示例代码:
```java
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class ChineseTextExtractor {
public static void main(String[] args) {
String text = "<p>这是一段中文文本。This is some English text. 这是另一段中文。</p><div><img src=\"image.jpg\"></div>";
Pattern pattern = Pattern.compile("[\u4e00-\u9fa5]+"); // 匹配中文字符
Matcher matcher = pattern.matcher(text);
while (matcher.find()) {
System.out.println(matcher.group()); // 输出中文字符
}
}
}
```
运行以上代码,将输出以下结果:
```
这是一段中文文本
这是另一段中文
```
相关问题
<div id="wea_rich_text_default_font" style="font-family:微软雅黑;font-size:12;"><p><img alt="" src="/weaver/weaver.file.FileDownload?fileid=aaa9aee4717d33272bd7ea028fa03118b693919f23b18febf9f6cee1158e8f4cf027542c71c8cf98d63770ccdf3bd1750e6b92e28c43dccd4" /></p><div class="ckeditor-html5-video" data-widget="html5video" style="text-align:left"><video controls="controls" src="/weaver/weaver.file.FileDownload?fileid=aad6f413f83191673980c5ee24b412880d6b9e8703caca411faec3276fe8133f5fa7e34630ca89ace63770ccdf3bd175071362141037cfb4e&download=1" style="max-width:100%"> </video></div><table border="1" cellpadding="1" style="width:500px;"> <tbody> <tr> <td style="padding: 1px;">1</td> <td style="padding: 1px;">1</td> </tr> <tr> <td style="padding: 1px;">2</td> <td style="padding: 1px;">2</td> </tr> <tr> <td style="padding: 1px;">3</td> <td style="padding: 1px;">3<a href="http://localhost:8080/wui/index.html#/main/portal/portal-1-1?menuIds=0,1&menuPathIds=0,1&_key=zq8830" target="_blank">http://localhost:8080/wui/index.html#/main/portal/portal-1-1?menuIds=0,1&menuPathIds=0,1&_key=zq8830</a></td> </tr> </tbody></table><p>测试<a href="http://localhost:8080/wui/index.html#/main/portal/portal-1-1?menuIds=0,1&menuPathIds=0,1&_key=zq8830" target="_blank">http://localhost:8080/wui/index.html#/main/portal/portal-1-1?menuIds=0,1&menuPathIds=0,1&_key=zq8830</a></p><p> </p><p>修改一下吧 qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq<img alt="" src="/weaver/weaver.file.FileDownload?fileid=a7617945ec5f52ec80aaa43ee8504de0a1b14d5eca4a98834494c85349762c626dec7ba8d0da277106ee600d27743f4e44f710fbddd167603" /></p></div>
这段代码是一个HTML页面的代码,其中包含了一张图片、一个视频、一个表格和一些文本内容。该HTML页面使用了一些样式,如字体和字号,以及一些链接。具体的代码解析如下:
```
<div id="wea_rich_text_default_font" style="font-family:微软雅黑;font-size:12;">
```
这是一个包含了样式信息的div标签,其中指定了字体为微软雅黑,字号为12。
```
<p><img alt="" src="/weaver/weaver.file.FileDownload?fileid=aaa9aee4717d33272bd7ea028fa03118b693919f23b18febf9f6cee1158e8f4cf027542c71c8cf98d63770ccdf3bd1750e6b92e28c43dccd4" /></p>
```
这是一个包含了一张图片的p标签,其中指定了图片的路径和alt属性为空。
```
<div class="ckeditor-html5-video" data-widget="html5video" style="text-align:left">
<video controls="controls" src="/weaver/weaver.file.FileDownload?fileid=aad6f413f83191673980c5ee24b412880d6b9e8703caca411faec3276fe8133f5fa7e34630ca89ace63770ccdf3bd175071362141037cfb4e&download=1" style="max-width:100%"> </video>
</div>
```
这是一个包含了一个视频的div标签,其中指定了视频的路径和样式信息。视频使用了HTML5的video标签,并且指定了控件和最大宽度为100%。
```
<table border="1" cellpadding="1" style="width:500px;">
<tbody>
<tr>
<td style="padding: 1px;">1</td>
<td style="padding: 1px;">1</td>
</tr>
<tr>
<td style="padding: 1px;">2</td>
<td style="padding: 1px;">2</td>
</tr>
<tr>
<td style="padding: 1px;">3</td>
<td style="padding: 1px;">3<a href="http://localhost:8080/wui/index.html#/main/portal/portal-1-1?menuIds=0,1&menuPathIds=0,1&_key=zq8830" target="_blank">http://localhost:8080/wui/index.html#/main/portal/portal-1-1?menuIds=0,1&menuPathIds=0,1&_key=zq8830</a></td>
</tr>
</tbody>
</table>
```
这是一个包含了一个表格的table标签,其中指定了表格的样式和边框为1像素。表格中包含了三行数据,每行数据有两列,第三行的第二列还包含了一个链接。
```
<p>测试<a href="http://localhost:8080/wui/index.html#/main/portal/portal-1-1?menuIds=0,1&menuPathIds=0,1&_key=zq8830" target="_blank">http://localhost:8080/wui/index.html#/main/portal/portal-1-1?menuIds=0,1&menuPathIds=0,1&_key=zq8830</a></p>
```
这是一个包含了一个链接的p标签,其中指定了链接的路径和打开方式。
```
<p> </p>
```
这是一个空的p标签,用于在文本内容之间添加一个空行。
```
<p>修改一下吧 qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq<img alt="" src="/weaver/weaver.file.FileDownload?fileid=a7617945ec5f52ec80aaa43ee8504de0a1b14d5eca4a98834494c85349762c626dec7ba8d0da277106ee600d27743f4e44f710fbddd167603" /></p>
```
这是一个包含了一张图片的p标签,其中指定了图片的路径和alt属性为空。
quill保存内容格式为{\"insert\":{\"image\":\"./cmm/showFile?fileType=image&fileId=2c908354888ac14f01888e39e570005b\"}}quill如何获取保存的图片
要获取Quill保存的图片,你需要先解析Quill的Delta格式,然后找到Delta中包含图片的那个insert对象。具体的步骤如下:
1. 获取Quill的Delta格式内容。
例如,你有一个Quill保存的内容字符串,可以通过以下代码将其解析为Delta格式:
```
var delta = JSON.parse(quillContent);
```
其中,quillContent是你保存的Quill内容字符串。
2. 找到Delta中包含图片的那个insert对象。
遍历Delta中的每个insert对象,查找其中包含图片的那个对象。你可以通过判断insert对象中是否包含image属性来找到图片对象,例如:
```
var imageInsert = delta.ops.find(function(op) {
return op.insert && op.insert.image;
});
```
其中,imageInsert就是包含图片的insert对象。
3. 获取图片的URL。
imageInsert对象中的image属性保存了图片的URL地址。你可以通过以下代码获取该URL:
```
var imageUrl = imageInsert.insert.image;
```
其中,imageUrl就是保存的图片的URL地址。你可以将其用于显示图片等操作。