java扒取网页,获取所需要内容列表展示
时间: 2024-03-07 16:50:59 浏览: 22
要从网页中获取所需的内容,可以使用 Java 中的 Jsoup 库。以下是一个简单的示例,从网页中获取标题和链接,并将它们显示在列表中:
```java
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import javax.swing.*;
import java.awt.*;
import java.io.IOException;
public class WebScraper extends JFrame {
private DefaultListModel<String> listModel;
private JList<String> list;
public WebScraper() {
super("Web Scraper");
listModel = new DefaultListModel<>();
list = new JList<>(listModel);
JScrollPane scrollPane = new JScrollPane(list);
getContentPane().add(scrollPane, BorderLayout.CENTER);
setSize(400, 300);
setDefaultCloseOperation(JFrame.EXIT_ON_CLOSE);
setVisible(true);
scrape();
}
private void scrape() {
String url = "https://www.example.com/";
try {
Document doc = Jsoup.connect(url).get();
Elements links = doc.select("a[href]");
for (Element link : links) {
String title = link.text();
String href = link.attr("href");
listModel.addElement(title + " - " + href);
}
} catch (IOException e) {
e.printStackTrace();
}
}
public static void main(String[] args) {
new WebScraper();
}
}
```
在这个例子中,我们使用 Jsoup 连接到指定的网址,然后使用 CSS 选择器选择所有包含 href 属性的 a 元素。对于每个链接,我们获取标题和链接地址,并将它们添加到列表模型中。最后,我们将列表模型设置为 JList 的模型,以便将结果显示在用户界面中。