首页java编写一个爬虫程序

java编写一个爬虫程序

时间: 2024-05-03 15:21:49 浏览: 114

由于爬虫程序需要访问网络并获取数据，因此我们需要用到Java中的网络编程相关类库，如java.net和java.io等。

以下是一个简单的Java爬虫程序，可以获取指定网页的HTML源码：

import java.net.*;
import java.io.*;

public class SimpleCrawler {
    public static void main(String[] args) {
        try {
            URL url = new URL("http://www.baidu.com");
            BufferedReader in = new BufferedReader(new InputStreamReader(url.openStream()));

            String inputLine;
            while ((inputLine = in.readLine()) != null) {
                System.out.println(inputLine);
            }
            in.close();
        } catch (IOException e) {
            System.out.println("Error: " + e.getMessage());
        }
    }
}