java 抓取网页_java抓取网页
时间: 2023-10-15 07:01:43 浏览: 208
Java 抓取网页的方式有很多种,其中比较常用的方式是使用 Java 提供的 URL 和 HttpURLConnection 类来实现。
以下是一个简单的 Java 抓取网页的示例代码:
```java
import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.net.HttpURLConnection;
import java.net.URL;
public class WebPageFetcher {
public static void main(String[] args) {
try {
// 创建URL对象
URL url = new URL("https://www.example.com");
// 打开URL连接
HttpURLConnection conn = (HttpURLConnection) url.openConnection();
// 设置请求方式为GET
conn.setRequestMethod("GET");
// 获取输入流
BufferedReader in = new BufferedReader(new InputStreamReader(conn.getInputStream()));
String line;
// 读取数据
while ((line = in.readLine()) != null) {
System.out.println(line);
}
// 关闭输入流
in.close();
} catch (Exception e) {
e.printStackTrace();
}
}
}
```
以上代码使用 HttpURLConnection 对象向指定 URL 发送 GET 请求,并将响应数据输出到控制台。可以根据需要进行修改,例如添加请求头、设置超时时间等。
阅读全文