java解析html
时间: 2023-07-01 14:19:01 浏览: 43
Java有多种解析HTML的方式,其中比较流行的是使用Jsoup库。以下是一个简单的示例代码:
```java
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class HtmlParser {
public static void main(String[] args) {
String html = "<html><head><title>Jsoup Example</title></head>"
+ "<body><p>Jsoup is a Java library for working with real-world HTML.</p>"
+ "<p>It provides a very convenient API for extracting and manipulating data, using the best of DOM, CSS, and jquery-like methods.</p></body></html>";
// 解析HTML字符串
Document doc = Jsoup.parse(html);
// 获取title元素
Element title = doc.select("title").first();
System.out.println("Title: " + title.text());
// 获取所有段落元素
Elements paragraphs = doc.select("p");
for (Element p : paragraphs) {
System.out.println("Paragraph: " + p.text());
}
}
}
```
这个示例代码中,我们使用Jsoup库来解析HTML字符串,获取title元素和所有段落元素,并输出它们的文本内容。你可以根据自己的需求修改代码来解析具体的HTML页面。