python爬取豆瓣top25导演名
时间: 2023-10-07 07:12:50 浏览: 40
好的,以下是爬取豆瓣电影Top25导演名的Python代码:
```python
import requests
from bs4 import BeautifulSoup
# 发送请求
url = 'https://movie.douban.com/top250'
response = requests.get(url)
# 解析HTML页面
soup = BeautifulSoup(response.text, 'html.parser')
movie_list = soup.find('ol', class_='grid_view').find_all('li')
# 获取每部电影的导演名
for movie in movie_list:
director = movie.find('div', class_='bd').find('p').text.split('\n')[1].strip().split(' ')[0]
print(director)
```
运行上述代码,即可输出豆瓣电影Top25的导演名。
相关问题
如何用python爬取豆瓣top25的导演名
可以使用Python中的requests和BeautifulSoup库来实现爬取豆瓣电影Top25的导演名。具体步骤如下:
1. 使用requests库发送HTTP请求,获取豆瓣电影Top25的页面内容。
2. 使用BeautifulSoup库对页面内容进行解析,提取导演名信息。
3. 将提取的导演名信息保存到一个列表中,最后输出结果。
以下是代码示例:
```python
import requests
from bs4 import BeautifulSoup
url = 'https://movie.douban.com/top250'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
directors = []
for movie in soup.find_all('div', class_='info'):
director = movie.find('div', class_='bd').p.text.split('/')[0].strip()
directors.append(director)
for i, director in enumerate(directors):
print(f'{i+1}. {director}')
```
以上代码会输出豆瓣电影Top25的导演名,按照排名顺序依次列出。
python爬取豆瓣TOP250生成excel
要使用Python爬取豆瓣TOP250并生成Excel文件,可以按照以下步骤进行操作:
1. 使用requests库获取网页源代码,使用BeautifulSoup库解析网页内容,获取电影名称、评分、导演等信息。
2. 使用openpyxl库创建Excel文件,并在其中创建一个工作表。
3. 将获取到的电影信息写入Excel文件中。
4. 保存Excel文件。
下面是一个简单的代码示例:
```
import requests
from bs4 import BeautifulSoup
from openpyxl import Workbook
# 获取网页源代码
url = 'https://movie.douban.com/top250'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
# 创建Excel文件
wb = Workbook()
ws = wb.active
ws.append(['电影名称', '评分', '导演'])
# 获取电影信息并写入Excel文件
for movie in soup.find_all('div', class_='info'):
name = movie.find('span', class_='title').text
rating = movie.find('span', class_='rating_num').text
director = movie.find('p').text.split('\n')[1].strip()
ws.append([name, rating, director])
# 保存Excel文件
wb.save('top250.xlsx')
```
相关推荐
![rar](https://img-home.csdnimg.cn/images/20210720083606.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)