用Python爬取豆瓣网的电影排行榜
时间: 2023-12-18 09:05:13 浏览: 79
您好!以下是用Python爬取豆瓣网的电影排行榜的步骤:
1. 打开豆瓣电影排行榜页面:https://movie.douban.com/chart
2. 分析页面结构,找到电影排行榜所在的HTML标签。可以使用Chrome浏览器的开发者工具来帮助分析。
3. 使用Python的requests库向豆瓣电影排行榜页面发送HTTP请求,并将响应内容解析为BeautifulSoup对象。
4. 使用BeautifulSoup对象的find_all方法找到所有电影的信息所在的HTML标签。
5. 遍历每个电影的信息标签,提取出电影名称、评分等信息,并保存到文件或数据库中。
下面是一段示例代码:
```python
import requests
from bs4 import BeautifulSoup
url = 'https://movie.douban.com/chart'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
movies = soup.find_all('div', class_='pl2')
for movie in movies:
name = movie.find('a').text.strip()
rating = movie.find('span', class_='rating_nums').text.strip()
print(f'{name} {rating}')
```
这个示例代码只是简单地输出每个电影的名称和评分,您可以根据需求进行修改和扩展。希望能帮到您!
阅读全文