java 获取html文本中 img 标签 src 数据
时间: 2024-04-07 18:33:56 浏览: 111
您可以使用Java中的正则表达式来获取HTML文本中的img标签的src属性数据。以下是一个示例代码:
```java
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class HtmlParser {
public static void main(String[] args) {
String htmlText = "<html><body><img src=\"image1.jpg\"><img src=\"image2.jpg\"></body></html>";
// 使用正则表达式匹配img标签的src属性
Pattern pattern = Pattern.compile("<img[^>]+src\\s*=\\s*['\"]([^'\"]+)['\"][^>]*>");
Matcher matcher = pattern.matcher(htmlText);
// 遍历匹配结果
while (matcher.find()) {
String src = matcher.group(1);
System.out.println("Image source: " + src);
}
}
}
```
这段代码将输出:
```
Image source: image1.jpg
Image source: image2.jpg
```
通过使用正则表达式,我们可以匹配所有的img标签,并提取出其src属性的值。请注意,使用正则表达式来解析HTML并不是最佳的方法,因为HTML是一种复杂的结构化语言,可能存在各种各样的情况。对于更复杂的HTML解析任务,您可能需要使用专门的HTML解析库,如jsoup。
阅读全文