java爬取国家统计局行政区划
时间: 2023-11-12 07:00:32 浏览: 144
您好,可以使用Java的Jsoup库来爬取国家统计局行政区划信息。具体步骤如下:
1. 打开国家统计局行政区划页面:http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/
2. 使用Jsoup库获取页面内容,并解析出需要的信息。
3. 遍历解析出的信息,可以将其存储到数据库或者文件中。
以下是示例代码:
```java
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import java.io.IOException;
public class Main {
public static void main(String[] args) throws IOException {
// 打开国家统计局行政区划页面
String url = "http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/";
Document doc = Jsoup.connect(url).get();
// 解析出需要的信息
Elements provinces = doc.select("tr.provincetr td a");
for (Element province : provinces) {
String provinceName = province.text();
String provinceUrl = url + province.attr("href");
System.out.println(provinceName + " " + provinceUrl);
Document provinceDoc = Jsoup.connect(provinceUrl).get();
Elements cities = provinceDoc.select("tr.citytr td a");
for (Element city : cities) {
String cityName = city.text();
String cityUrl = url + city.attr("href");
System.out.println("\t" + cityName + " " + cityUrl);
Document cityDoc = Jsoup.connect(cityUrl).get();
Elements counties = cityDoc.select("tr.countytr td a");
for (Element county : counties) {
String countyName = county.text();
String countyUrl = url + county.attr("href");
System.out.println("\t\t" + countyName + " " + countyUrl);
}
}
}
}
}
```
阅读全文