写一个java程序爬取武汉大学课表
时间: 2023-02-07 21:43:23 浏览: 142
java课件 武汉大学
这是一个使用 Java 编写的爬取武汉大学课表的程序的示例:
```
import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.net.URL;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class WuhanUniversityCourseSchedule {
public static void main(String[] args) throws Exception {
// 获取网页源代码
URL url = new URL("http://jwc.whu.edu.cn/");
BufferedReader reader = new BufferedReader(new InputStreamReader(url.openStream()));
String line;
StringBuilder content = new StringBuilder();
while ((line = reader.readLine()) != null) {
content.append(line);
}
reader.close();
// 使用正则表达式提取课表信息
String pattern = "(<td>.*?</td>)+";
Pattern r = Pattern.compile(pattern);
Matcher m = r.matcher(content);
while (m.find()) {
System.out.println(m.group());
}
}
}
```
在这个示例中,我们使用 Java 的 `URL` 和 `BufferedReader` 类来获取网页的源代码,然后使用正则表达式来提取课表信息。
请注意,这只是一个简单的示例,实际的爬虫程序可能会更复杂,可能需要考虑多种因素,如网络异常、网站反爬虫措施等。此外,还需注意遵守网络爬虫相关的法律法规。
阅读全文