用Java写一段行爬取中医相关理论和知识的代码
时间: 2024-06-10 10:05:14 浏览: 9
好的,以下是一个简单的Java爬虫示例代码,用于获取中医相关理论和知识:
```java
import java.io.IOException;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class TCMKnowledgeCrawler {
public static void main(String[] args) throws IOException {
String url = "http://www.jiankang.com/zhibing/tcm/tcmjy/";
Document doc = Jsoup.connect(url).get();
Elements links = doc.select("div.wrap div.left a");
for (Element link : links) {
String articleUrl = "http://www.jiankang.com" + link.attr("href");
String articleTitle = link.text();
Document articleDoc = Jsoup.connect(articleUrl).get();
Element articleContent = articleDoc.select("div.mainContent").first();
System.out.println("文章标题:" + articleTitle);
System.out.println("文章链接:" + articleUrl);
System.out.println("文章内容:" + articleContent.text());
System.out.println("----------------------------------------");
}
}
}
```
这段代码使用了JSoup库来进行网页解析和数据提取。它首先访问“http://www.jiankang.com/zhibing/tcm/tcmjy/”页面,然后获取页面中所有的中医理论知识文章的链接,并逐一访问每个链接,提取文章标题、链接和内容后输出。你可以根据需要进行修改以适应其他网站。
相关推荐
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)