java 获取html文本中 img 标签 src 数据
时间: 2024-04-07 11:33:57 浏览: 11
您可以使用Java的正则表达式来提取HTML文本中img标签的src数据。以下是一个示例代码:
```java
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class HTMLParser {
public static void main(String[] args) {
String html = "<html><body><img src=\"image1.jpg\"><img src=\"image2.jpg\"></body></html>";
// 定义正则表达式
String regex = "<img\\s+src\\s*=\\s*\"([^\"]+)\"\\s*>";
Pattern pattern = Pattern.compile(regex);
// 匹配正则表达式
Matcher matcher = pattern.matcher(html);
// 提取src数据
while (matcher.find()) {
String src = matcher.group(1);
System.out.println("Image src: " + src);
}
}
}
```
在上述代码中,我们使用正则表达式`<img\\s+src\\s*=\\s*\"([^\"]+)\"\\s*>`来匹配img标签,并使用`matcher.group(1)`提取src数据。运行该代码,将输出两个img标签的src数据:
```
Image src: image1.jpg
Image src: image2.jpg
```
请注意,使用正则表达式来解析HTML文本可能不是最佳的方法。更好的选择是使用专门的HTML解析库,如jsoup,它提供了更简单和可靠的方法来提取HTML中的元素和属性。