BeautifulSoup爬取豆瓣电影票房
时间: 2023-12-14 16:03:33 浏览: 139
本文将介绍如何使用Python的BeautifulSoup库爬取豆瓣电影票房信息。
首先,我们需要打开豆瓣电影票房页面,例如:https://movie.douban.com/chart。然后,我们可以使用Python的requests库获取页面内容:
```python
import requests
url = 'https://movie.douban.com/chart'
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
response = requests.get(url, headers=headers)
html_content = response.text
```
接下来,我们可以使用BeautifulSoup库解析页面内容:
```python
from bs4 import BeautifulSoup
soup = BeautifulSoup(html_content, 'lxml')
# 找到票房榜的列表
table = soup.find('table', class_='chart')
# 找到列表中的所有电影
movies = table.find_all('tr')[1:]
# 遍历电影列表,提取电影信息
for movie in movies:
rank = movie.find('td', class_='rank').text.strip() # 排名
title = movie.find('td', class_='title').a.text.strip() # 电影名
cast = movie.find('td', class_='cast').text.strip() # 主演
box_office = movie.find('td', class_='box-office').text.strip() # 票房
print(rank, title, cast, box_office)
```
运行上述代码,即可输出豆瓣电影票房榜的电影信息。
阅读全文