爬虫获取猫眼经典电影的详细信息(名称、类型、制片国家/地区、片长、上映时间、评分、累计票房)
时间: 2023-10-27 18:06:37 浏览: 117
好的,我可以为您提供一个爬虫程序来获取猫眼经典电影的详细信息。首先,我们需要安装requests和BeautifulSoup库。您可以使用以下命令进行安装:
```
pip install requests
pip install beautifulsoup4
```
接下来,您可以使用以下代码实现爬虫程序:
```python
import requests
from bs4 import BeautifulSoup
url = 'https://maoyan.com/films?showType=3'
# 获取页面信息
def get_html(url):
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0;Win64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
response = requests.get(url, headers=headers)
if response.status_code == 200:
return response.text
else:
return None
# 解析页面信息
def parse_html(html):
soup = BeautifulSoup(html, 'html.parser')
movie_list = soup.find_all('div', class_='movie-hover-info')
for movie in movie_list:
name = movie.find('span', class_='name').text
movie_type = movie.find_all('div', class_='movie-hover-title')[1].text.strip().replace('\n', '').split(':')[1]
country = movie.find_all('div', class_='movie-hover-title')[0].text.strip().replace('\n', '').split(':')[1]
movie_time = movie.find_all('div', class_='movie-hover-title')[3].text.strip().replace('\n', '').split(':')[1]
release_date = movie.find_all('div', class_='movie-hover-title')[2].text.strip().replace('\n', '').split(':')[1]
score = movie.find('span', class_='score').text
box_office = movie.find_all('span', class_='stonefont')[1].text
print('电影名称:', name)
print('电影类型:', movie_type)
print('制片国家/地区:', country)
print('片长:', movie_time)
print('上映时间:', release_date)
print('评分:', score)
print('累计票房:', box_office)
if __name__ == '__main__':
html = get_html(url)
parse_html(html)
```
运行代码后,程序会输出猫眼经典电影的详细信息,包括电影名称、类型、制片国家/地区、片长、上映时间、评分、累计票房。
阅读全文