python re模块爬取豆瓣250海报
时间: 2023-11-17 11:04:47 浏览: 135
以下是使用Python re模块爬取豆瓣250电影海报的代码:
```python
import requests
import re
# 获取网页内容
url = 'https://movie.douban.com/top250'
response = requests.get(url)
content = response.text
# 使用正则表达式匹配海报链接
pattern = re.compile(r'<img.*?src="(.*?)"', re.S)
results = re.findall(pattern, content)
# 下载海报
for i, result in enumerate(results):
response = requests.get(result)
with open(f'{i}.jpg', 'wb') as f:
f.write(response.content)
```
该代码首先使用requests模块获取豆瓣电影Top250的网页内容,然后使用正则表达式匹配出所有海报的链接,最后使用requests模块下载海报并保存到本地。
阅读全文