首页python爬虫入门代码豆瓣电影top250

python爬虫入门代码豆瓣电影top250

时间: 2024-10-10 11:06:12 浏览: 40

Python爬虫入门可以先从简单的豆瓣电影Top250排行榜开始。以下是一个基本的示例，使用`requests`库获取网页内容，然后使用`BeautifulSoup`解析HTML。请注意，实际运行此代码前需要先安装这两个库（`pip install requests beautifulsoup4`）。 ```python import requests from bs4 import BeautifulSoup def get_douban_top250(): url = "https://movie.douban.com/top250" # 发送GET请求 response = requests.get(url) # 检查请求是否成功 if response.status_code == 200: # 使用BeautifulSoup解析响应的HTML内容 soup = BeautifulSoup(response.text, 'lxml') # 找到电影列表的div标签，通常这个id是'main-wrap' movie_list = soup.find('ol', id='main-wrap').find_all('li', class_='hd') for movie in movie_list: title = movie.h3.a.text.strip() # 电影标题 rating = movie.strong.span['class'][0] if movie.strong else None # 评分 print(f"电影名：{title}\n评分：{rating}\n---") else: print("获取数据失败，状态码：", response.status_code) # 调用函数 get_douban_top250() ```

阅读全文