d?fileid=aaa9aee4717d33272bd7ea028fa03118b693919f23b18febf9f6cee1158e8f4cf027542c71c8cf98d63770ccdf3bd1750e6b92e28c43dccd4" /></p><div class="ckeditor-html5-video" data-widget="html5video" style="text-align:left"><video controls="controls" src="/weaver/weaver.file.FileDownload?fileid=aad6f413f83191673980c5ee24b412880d6b9e8703caca411faec3276fe8133f5fa7e34630ca89ace63770ccdf3bd175071362141037cfb4e&download=1" style="max-width:100%"> </video></div><table border="1" cellpadding="1" style="width:500px;"> <tbody> <tr> <td style="padding: 1px;">1</td> <td style="padding: 1px;">1</td> </tr> <tr> <td style="padding: 1px;">2</td> <td style="padding: 1px;">2</td> </tr> <tr> <td style="padding: 1px;">3</td> <td style="padding: 1px;">3<a href="http://localhost:8080/wui/index.html#/main/portal/portal-1-1?menuIds=0,1&menuPathIds=0,1&_key=zq8830" target="_blank">http://localhost:8080/wui/index.html#/main/portal/portal-1-1?menuIds=0,1&menuPathIds=0,1&_key=zq8830</a></td> </tr> </tbody></table><p>测试<a href="http://localhost:8080/wui/index.html#/main/portal/portal-1-1?menuIds=0,1&menuPathIds=0,1&_key=zq8830" target="_blank">http://localhost:8080/wui/index.html#/main/portal/portal-1-1?menuIds=0,1&menuPathIds=0,1&_key=zq8830</a></p><p> </p><p>修改一下吧 qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq<img alt="" src="/weaver/weaver.file.FileDownload?fileid=a7617945ec5f52ec80aaa43ee8504de0a1b14d5eca4a98834494c85349762c626dec7ba8d0da277106ee600d27743f4e44f710fbddd167603" /></p></div> Java获取文本中文字内容,不要图片,视频等
时间: 2024-01-03 19:41:13 浏览: 120
您可以使用Java正则表达式来获取文本中的中文内容,同时忽略图片、视频等非中文内容。以下是一个示例代码:
```java
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class ChineseTextExtractor {
public static void main(String[] args) {
String text = "<p>这是一段中文文本。This is some English text. 这是另一段中文。</p><div><img src=\"image.jpg\"></div>";
Pattern pattern = Pattern.compile("[\u4e00-\u9fa5]+"); // 匹配中文字符
Matcher matcher = pattern.matcher(text);
while (matcher.find()) {
System.out.println(matcher.group()); // 输出中文字符
}
}
}
```
运行以上代码,将输出以下结果:
```
这是一段中文文本
这是另一段中文
```
相关问题
d?fileid=aaa9aee4717d33272bd7ea028fa03118b693919f23b18febf9f6cee1158e8f4cf027542c71c8cf98d63770ccdf3bd1750e6b92e28c43dccd4" /></p><div class="ckeditor-html5-video" data-widget="html5video" style="text-align:left"><video controls="controls" src="/weaver/weaver.file.FileDownload?fileid=aad6f413f83191673980c5ee24b412880d6b9e8703caca411faec3276fe8133f5fa7e34630ca89ace63770ccdf3bd175071362141037cfb4e&download=1" style="max-width:100%"> </video></div><table border="1" cellpadding="1" style="width:500px;"> <tbody> <tr> <td style="padding: 1px;">1</td> <td style="padding: 1px;">1</td> </tr> <tr> <td style="padding: 1px;">2</td> <td style="padding: 1px;">2</td> </tr> <tr> <td style="padding: 1px;">3</td> <td style="padding: 1px;">3<a href="http://localhost:8080/wui/index.html#/main/portal/portal-1-1?menuIds=0,1&menuPathIds=0,1&_key=zq8830" target="_blank">http://localhost:8080/wui/index.html#/main/portal/portal-1-1?menuIds=0,1&menuPathIds=0,1&_key=zq8830</a></td> </tr> </tbody></table><p>测试<a href="http://localhost:8080/wui/index.html#/main/portal/portal-1-1?menuIds=0,1&menuPathIds=0,1&_key=zq8830" target="_blank">http://localhost:8080/wui/index.html#/main/portal/portal-1-1?menuIds=0,1&menuPathIds=0,1&_key=zq8830</a></p><p> </p><p>修改一下吧 qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq<img alt="" src="/weaver/weaver.file.FileDownload?fileid=a7617945ec5f52ec80aaa43ee8504de0a1b14d5eca4a98834494c85349762c626dec7ba8d0da277106ee600d27743f4e44f710fbddd167603" /></p></div> Java获取内<p>标签里的》
您可以使用Java正则表达式来获取`<p>`标签内的内容。以下是一个示例代码:
```java
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class PTagExtractor {
public static void main(String[] args) {
String html = "<div><p>这是一段<p>嵌套的</p>文本。</p><p>这是另一段文本。</p></div>";
Pattern pattern = Pattern.compile("<p>(.*?)</p>"); // 匹配<p>标签及其内部内容
Matcher matcher = pattern.matcher(html);
while (matcher.find()) {
System.out.println(matcher.group(1)); // 输出<p>标签内的内容
}
}
}
```
运行以上代码,将输出以下结果:
```
这是一段<p>嵌套的</p>文本。
这是另一段文本。
```
quill保存内容格式为{\"insert\":{\"image\":\"./cmm/showFile?fileType=image&fileId=2c908354888ac14f01888e39e570005b\"}}quill如何获取保存的图片
要获取Quill保存的图片,你需要先解析Quill的Delta格式,然后找到Delta中包含图片的那个insert对象。具体的步骤如下:
1. 获取Quill的Delta格式内容。
例如,你有一个Quill保存的内容字符串,可以通过以下代码将其解析为Delta格式:
```
var delta = JSON.parse(quillContent);
```
其中,quillContent是你保存的Quill内容字符串。
2. 找到Delta中包含图片的那个insert对象。
遍历Delta中的每个insert对象,查找其中包含图片的那个对象。你可以通过判断insert对象中是否包含image属性来找到图片对象,例如:
```
var imageInsert = delta.ops.find(function(op) {
return op.insert && op.insert.image;
});
```
其中,imageInsert就是包含图片的insert对象。
3. 获取图片的URL。
imageInsert对象中的image属性保存了图片的URL地址。你可以通过以下代码获取该URL:
```
var imageUrl = imageInsert.insert.image;
```
其中,imageUrl就是保存的图片的URL地址。你可以将其用于显示图片等操作。
阅读全文