jsoup 爬取公众号标题时间
时间: 2023-11-07 22:53:38 浏览: 147
您可以使用jsoup库来爬取公众号的标题和时间。以下是一个简单的示例代码:
```java
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class WechatCrawler {
public static void main(String[] args) throws Exception {
String url = "https://mp.weixin.qq.com/s/xxxxx"; // 公众号文章链接
Document doc = Jsoup.connect(url).get();
String title = doc.select("h2.rich_media_title").text(); // 获取标题
String time = doc.select("em#post-date").text(); // 获取时间
System.out.println("标题:" + title);
System.out.println("时间:" + time);
}
}
```
在代码中,首先使用`Jsoup.connect(url).get()`方法获取公众号文章的页面内容,然后使用`doc.select()`方法选择相应的元素,最后使用`.text()`方法获取元素的文本内容。在示例中,使用了`h2.rich_media_title`选择器来选择标题元素,使用`em#post-date`选择器来选择时间元素。您需要将示例代码中的链接替换为您要爬取的公众号文章链接。
阅读全文