用这种方式r'<ul><a href=.*?>(.*?)</a></ul>'爬取https://www.ntst.edu.cn/主页面通知通告部分
时间: 2024-05-28 11:03:32 浏览: 65
python使用xpath中遇到:<Element a at 0x39a9a80>到底是什么?
5星 · 资源好评率100%
可以使用Python的requests和re库来实现爬取,具体代码如下:
```python
import requests
import re
url = 'https://www.ntst.edu.cn/'
html = requests.get(url).text
notices = re.findall(r'<ul><a href=.*?>(.*?)</a></ul>', html)
for notice in notices:
print(notice)
```
这段代码首先使用requests库获取网页的html代码,然后使用正则表达式r'<ul><a href=.*?>(.*?)</a></ul>'匹配出通知通告部分的内容,最后将结果打印出来。
阅读全文