Java 解析HTML
时间: 2023-09-25 09:15:28 浏览: 60
Java 可以使用许多库来解析 HTML。以下是一些常用的库:
1. Jsoup:Jsoup 是一个开源的 Java HTML 解析器,可用于从 HTML 中提取数据。它提供了一组易于使用的 API,可以帮助您快速解析 HTML、查找和提取所需的元素。
2. HTML Parser:HTML Parser 是另一个流行的 Java HTML 解析器。它提供了一组 API,可以帮助您解析 HTML、查找和提取所需的元素。
3. TagSoup:TagSoup 是一个免费的、开放源代码的解析器,可以解析标准的 HTML、XHTML 和 XML 文档。它可以将不规范的 HTML 转换为标准的 XML 文档,并提供了一组 API,可以帮助您解析 XML 文档。
下面是一个使用 Jsoup 解析 HTML 的示例代码:
```java
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class HtmlParserExample {
public static void main(String[] args) throws Exception {
String html = "<html><head><title>Jsoup Example</title></head>"
+ "<body><p>Jsoup is a Java HTML parser.</p></body></html>";
Document doc = Jsoup.parse(html);
String title = doc.title();
System.out.println("Title: " + title);
Element body = doc.body();
Elements paragraphs = body.getElementsByTag("p");
for (Element paragraph : paragraphs) {
System.out.println("Paragraph: " + paragraph.text());
}
}
}
```
输出:
```
Title: Jsoup Example
Paragraph: Jsoup is a Java HTML parser.
```