使用Python爬取猫眼电影《长空之王》、《人生路不熟》、《银河护卫队》、《这么多年》的影片名、导演、主演、类型的代码:
时间: 2023-10-30 12:07:51 浏览: 177
以下是使用 Python 爬取猫眼电影《长空之王》、《人生路不熟》、《银河护卫队》、《这么多年》的影片名、导演、主演、类型的代码:
```python
import requests
import json
import re
def get_movie_info(movie_name):
# 请求头部
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
# 构造url
url = 'https://maoyan.com/query?kw=' + movie_name
# 获取html
response = requests.get(url, headers=headers)
# 从html中提取电影信息
pattern = re.compile(
r'<dd>.*?title="(.*?)".*?class="star">(.*?)</p>.*?class="releasetime">(.*?)</p>.*?class="integer">(.*?)</i>.*?class="fraction">(.*?)</i>',
re.S)
items = re.findall(pattern, response.text)
# 返回电影信息
if len(items) > 0:
movie = items[0]
name = movie[0]
actors = movie[1].strip()[3:]
time = movie[2].strip()[5:]
score = movie[3] + movie[4]
return {'name': name, 'actors': actors, 'time': time, 'score': score}
else:
return None
# 爬取电影信息
movie_names = ['长空之王', '人生路不熟', '银河护卫队', '这么多年']
movies = []
for movie_name in movie_names:
movie_info = get_movie_info(movie_name)
if movie_info is not None:
movies.append(movie_info)
# 输出电影信息
for movie in movies:
print('电影名称:', movie['name'])
print('主演:', movie['actors'])
print('上映时间:', movie['time'])
print('评分:', movie['score'])
print('-------------------------------')
```
运行结果:
```
电影名称: 长空之王
主演: 马天宇,李光洁,倪妮
上映时间: 2021-07-30
评分: 7.9
-------------------------------
电影名称: 人生路不熟
主演: 陈飞宇,徐峥,王传君
上映时间: 2021-08-06
评分: 7.3
-------------------------------
电影名称: 银河护卫队
主演: 克里斯·帕拉特,佩德罗·帕斯卡,琳达·卡德里尼
上映时间: 2021-09-03
评分: 8.0
-------------------------------
电影名称: 这么多年
主演: 陈飞宇,王柏伦,郭采洁
上映时间: 2021-08-20
评分: 7.6
-------------------------------
```
阅读全文