python利用正则表达式爬取网页信息的代码
时间: 2023-04-03 10:02:01 浏览: 152
Python使用正则表达式获取网页中所需要的信息
可以使用Python的re模块来实现正则表达式爬取网页信息,以下是一个示例代码:
```python
import re
import requests
url = "https://www.example.com"
response = requests.get(url)
html = response.text
# 使用正则表达式匹配网页中的所有链接
links = re.findall('<a href="(.*?)">', html)
# 输出所有链接
for link in links:
print(link)
```
这段代码可以爬取指定网页中的所有链接,并输出到控制台上。当然,具体的正则表达式模式需要根据实际情况进行调整。
阅读全文