首页从豆瓣电影top250网站爬取第1页电影信息源代码

从豆瓣电影top250网站爬取第1页电影信息源代码

时间: 2024-12-22 21:28:59 浏览: 37

在Python中，我们可以使用requests库来获取网页内容，然后BeautifulSoup库解析HTML提取数据。以下是一个简单的示例，展示如何从豆瓣电影Top250的第一页抓取电影名称和评分： ```python import requests from bs4 import BeautifulSoup # 设置URL url = "https://movie.douban.com/top250" # 发送GET请求 response = requests.get(url) # 检查请求是否成功（状态码200表示成功） if response.status_code == 200: # 解析HTML内容 soup = BeautifulSoup(response.text, 'lxml') # 查找电影标题和评分信息（假设它们在'title'和'score'的class名中） movie_data = soup.find_all('div', class_='hd') for movie in movie_data: title = movie.find('span', class_='title').text.strip() rating = movie.find('span', class_='rating_num')['class'][0][5] # 提取评分数字 print(f"电影标题: {title}") print(f"评分: {rating}/10") print("-

阅读全文