写一段java爬取数据的代码
时间: 2023-10-05 22:12:30 浏览: 46
以下是一个简单的 Java 爬虫示例,使用 Jsoup 库来获取网页内容并解析 HTML:
```java
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import java.io.IOException;
public class WebCrawler {
public static void main(String[] args) {
String url = "https://www.example.com";
try {
// 获取网页内容
Document doc = Jsoup.connect(url).get();
// 解析 HTML
Elements links = doc.select("a[href]");
// 输出所有链接
for (Element link : links) {
System.out.println(link.attr("href"));
}
} catch (IOException e) {
e.printStackTrace();
}
}
}
```
这个示例将获取 `https://www.example.com` 的网页内容,并输出页面中所有链接的 URL。你可以根据需要来修改代码,例如使用不同的选择器来查找特定的元素,或者将数据存储到数据库中等。
相关推荐
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![rar](https://img-home.csdnimg.cn/images/20210720083606.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![-](https://csdnimg.cn/download_wenku/file_type_column_c1.png)
![-](https://csdnimg.cn/download_wenku/file_type_column_c1.png)
![-](https://csdnimg.cn/download_wenku/file_type_column_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)