页面爬虫的Java 代码
时间: 2024-06-08 16:09:14 浏览: 52
基于Java开发的简单steam爬虫。使用jsoup+jdbc实现用户资料爬取存储以及商店页面游戏图片下载。.zip
以下是一个简单的 Java 页面爬虫代码示例:
```java
import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.net.URL;
public class PageCrawler {
public static void main(String[] args) throws Exception {
String url = "https://www.example.com";
URL obj = new URL(url);
BufferedReader in = new BufferedReader(new InputStreamReader(obj.openStream()));
String inputLine;
while ((inputLine = in.readLine()) != null) {
System.out.println(inputLine);
}
in.close();
}
}
```
这个代码使用 Java 的 URL 类打开指定的网址,并读取其中的内容。它使用 BufferedReader 类来逐行读取网页内容,并将其输出到控制台。请注意,此代码只能读取公共网页,而不能读取需要登录或具有其他访问权限的网页。
阅读全文