Java如何获取前后两个标签中所有的图片
时间: 2023-05-17 21:04:11 浏览: 101
Java可以使用Jsoup库来获取HTML中的标签和属性,然后使用正则表达式来匹配图片的URL。以下是示例代码:
```java
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class ImageExtractor {
public static void main(String[] args) throws Exception {
String html = "<html><body><div><img src='image1.jpg'></div><p>Some text</p><div><img src='image2.jpg'></div></body></html>";
Document doc = Jsoup.parse(html);
Elements divs = doc.select("div");
Pattern pattern = Pattern.compile("src=['\"](.*?)['\"]");
for (Element div : divs) {
String divHtml = div.html();
Matcher matcher = pattern.matcher(divHtml);
while (matcher.find()) {
String imageUrl = matcher.group(1);
System.out.println(imageUrl);
}
}
}
}
```
这个程序会输出两个图片的URL:`image1.jpg`和`image2.jpg`。
注意:这个程序只能获取HTML中的图片URL,如果图片是通过CSS背景图或JavaScript动态加载的,就无法获取了。
阅读全文