python爬虫豆瓣电影top250导演主演
时间: 2023-11-18 10:02:48 浏览: 102
python爬虫豆瓣电影TOP250,以及数据化分析
根据提供的引用内容,可以使用Python爬虫爬取豆瓣电影TOP250的信息,并从中获取导演和主演的信息。以下是实现此功能的步骤:
1. 使用Python的requests库向豆瓣电影TOP250的网页发送请求,并使用BeautifulSoup库解析网页内容。
2. 从网页中提取出每部电影的详情链接,并进入详情页面获取电影的详细信息。
3. 从电影详细信息中提取导演和主演的信息。
以下是代码示例:
```python
import requests
from bs4 import BeautifulSoup
# 请求豆瓣电影TOP250的网页
url = 'https://movie.douban.com/top250'
response = requests.get(url)
# 解析网页内容
soup = BeautifulSoup(response.text, 'html.parser')
# 获取每部电影的详情链接
movie_links = []
for movie in soup.select('.hd a'):
movie_links.append(movie['href'])
# 获取每部电影的详细信息
for link in movie_links:
response = requests.get(link)
soup = BeautifulSoup(response.text, 'html.parser')
# 获取导演和主演的信息
directors = [director.text for director in soup.select('.info span:nth-of-type(1) a')]
actors = [actor.text for actor in soup.select('.info span:nth-of-type(3) a')]
# 打印导演和主演的信息
print('导演:', directors)
print('主演:', actors)
```
阅读全文