用java写一个获取百度热点程序
时间: 2023-05-20 18:05:23 浏览: 129
利用java实现从百度网站上获取搜索数据
3星 · 编辑精心推荐
可以使用Java的网络编程库,通过HTTP请求获取百度热点页面的HTML代码,然后使用正则表达式或者HTML解析库来提取热点信息。以下是一个简单的示例代码:
```java
import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.net.HttpURLConnection;
import java.net.URL;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class BaiduHotspot {
public static void main(String[] args) {
try {
URL url = new URL("https://www.baidu.com/s?tn=news&rtt=4&bsst=1&cl=2&wd=%E7%83%AD%E7%82%B9");
HttpURLConnection conn = (HttpURLConnection) url.openConnection();
conn.setRequestMethod("GET");
conn.setRequestProperty("User-Agent", "Mozilla/5.0");
BufferedReader in = new BufferedReader(new InputStreamReader(conn.getInputStream(), "UTF-8"));
String line;
StringBuilder content = new StringBuilder();
while ((line = in.readLine()) != null) {
content.append(line);
}
in.close();
Pattern pattern = Pattern.compile("<a href=\".*?\" target=\"_blank\" class=\"title\">(.*?)</a>");
Matcher matcher = pattern.matcher(content.toString());
int i = 1;
while (matcher.find()) {
System.out.println(i + ". " + matcher.group(1));
i++;
}
} catch (Exception e) {
e.printStackTrace();
}
}
}
```
该程序通过访问百度新闻搜索页面,获取热点信息的HTML代码,然后使用正则表达式提取标题信息,并输出到控制台。
阅读全文