从豆瓣电影top250网站爬取第1页电影信息源代码
时间: 2024-12-22 21:28:59 浏览: 37
在Python中,我们可以使用requests库来获取网页内容,然后BeautifulSoup库解析HTML提取数据。以下是一个简单的示例,展示如何从豆瓣电影Top250的第一页抓取电影名称和评分:
```python
import requests
from bs4 import BeautifulSoup
# 设置URL
url = "https://movie.douban.com/top250"
# 发送GET请求
response = requests.get(url)
# 检查请求是否成功(状态码200表示成功)
if response.status_code == 200:
# 解析HTML内容
soup = BeautifulSoup(response.text, 'lxml')
# 查找电影标题和评分信息(假设它们在'title'和'score'的class名中)
movie_data = soup.find_all('div', class_='hd')
for movie in movie_data:
title = movie.find('span', class_='title').text.strip()
rating = movie.find('span', class_='rating_num')['class'][0][5] # 提取评分数字
print(f"电影标题: {title}")
print(f"评分: {rating}/10")
print("-
阅读全文