python爬虫入门代码豆瓣电影top250
时间: 2024-10-10 11:06:12 浏览: 40
Python爬虫入门可以先从简单的豆瓣电影Top250排行榜开始。以下是一个基本的示例,使用`requests`库获取网页内容,然后使用`BeautifulSoup`解析HTML。请注意,实际运行此代码前需要先安装这两个库(`pip install requests beautifulsoup4`)。
```python
import requests
from bs4 import BeautifulSoup
def get_douban_top250():
url = "https://movie.douban.com/top250"
# 发送GET请求
response = requests.get(url)
# 检查请求是否成功
if response.status_code == 200:
# 使用BeautifulSoup解析响应的HTML内容
soup = BeautifulSoup(response.text, 'lxml')
# 找到电影列表的div标签,通常这个id是'main-wrap'
movie_list = soup.find('ol', id='main-wrap').find_all('li', class_='hd')
for movie in movie_list:
title = movie.h3.a.text.strip() # 电影标题
rating = movie.strong.span['class'][0] if movie.strong else None # 评分
print(f"电影名:{title}\n评分:{rating}\n---")
else:
print("获取数据失败,状态码:", response.status_code)
# 调用函数
get_douban_top250()
```
阅读全文