python爬虫提取导演豆瓣影迷数量
时间: 2023-11-08 22:51:22 浏览: 64
可以使用 BeautifulSoup 和 requests 库来实现。首先需要使用 requests 库获取电影页面的 HTML 代码,然后使用 BeautifulSoup 解析 HTML 代码,找到导演和导演页面的链接。接着再次使用 requests 库获取导演页面的 HTML 代码,然后再次使用 BeautifulSoup 解析 HTML 代码,找到导演的豆瓣影迷数量。
以下是示例代码:
``` python
import requests
from bs4 import BeautifulSoup
# 电影页面 URL
url = 'https://movie.douban.com/subject/1292052/'
# 请求电影页面,获取 HTML 代码
response = requests.get(url)
html = response.text
# 使用 BeautifulSoup 解析 HTML 代码
soup = BeautifulSoup(html, 'html.parser')
# 找到导演和导演页面的链接
director_tag = soup.find('a', rel='v:directedBy')
director_name = director_tag.text.strip()
director_url = director_tag['href']
# 请求导演页面,获取 HTML 代码
response = requests.get(director_url)
html = response.text
# 使用 BeautifulSoup 解析 HTML 代码
soup = BeautifulSoup(html, 'html.parser')
# 找到导演的豆瓣影迷数量
fans_tag = soup.find('div', class_='info', id='fan_count')
fans_count = fans_tag.text.strip()
print('导演 {} 的豆瓣影迷数量为:{}'.format(director_name, fans_count))
```
需要注意的是,以上代码中使用的是电影《肖申克的救赎》的页面 URL,如果要获取其他电影的导演豆瓣影迷数量,需要修改 URL。同时,如果获取的导演页面中没有豆瓣影迷数量,可能需要根据实际情况修改代码。
阅读全文