python利用re模块的正则表达式,获取豆瓣网页电影封面
时间: 2024-11-10 11:14:29 浏览: 24
Python的re模块正则表达式操作
Python 的 `re` 模块主要用于处理字符串的正则表达式操作,如果你想从豆瓣网页上抓取电影封面图片链接,通常会涉及到网络爬虫技术。这里是一个基本示例,假设你想从某个包含电影封面URL的HTML结构中提取:
```python
import re
import requests
def get_cover(url):
# 发送请求获取页面内容
response = requests.get(url)
page_content = response.text
# 正则表达式匹配图片URL,这只是一个简单的例子,实际的匹配可能更复杂
pattern = r'src="(http://.*\.jpg|http://.*\.png)"' # 匹配jpg或png格式的URL
matches = re.findall(pattern, page_content)
# 提取第一个匹配到的链接作为封面URL
cover_url = matches[0] if matches else None
return cover_url
# 豆瓣电影详情页的URL
douban_movie_url = 'https://movie.douban.com/your-movie-url/'
cover_url = get_cover(douban_movie_url)
print("电影封面链接:", cover_url)
阅读全文