豆瓣电影Top250
时间: 2024-04-14 09:23:47 浏览: 318
豆瓣电影Top250是豆瓣网站根据用户评分和评价数量统计出的一份电影排行榜单,其中包含了豆瓣用户认可度较高的电影作品。以下是对豆瓣电影Top250的介绍:
1. 《肖申克的救赎》:这部由弗兰克·德拉邦特执导的电影是豆瓣电影Top250中排名第一的作品,它讲述了一个关于友谊、希望和自由的故事。
2. 《霸王别姬》:由陈凯歌执导的这部经典作品是中国电影的代表之一,它以京剧为背景,讲述了两位戏曲演员之间的纠葛与情感。
3. 《这个杀手不太冷》:这部由吕克·贝松执导的法国电影以其紧凑的剧情和精彩的动作场面而闻名,主要讲述了一位职业杀手与一个小女孩之间的故事。
4. 《阿甘正传》:这部由罗伯特·泽米吉斯执导的电影以其温暖感人的故事和托尼·汤普森的精彩表演而广受好评。
5. 《美丽人生》:这部由罗伯托·贝尼尼执导的意大利电影讲述了一个关于爱与希望的故事,它以其独特的方式展现了二战时期的人性与善良。
6. 《千与千寻》:这部由宫崎骏执导的日本动画电影是豆瓣电影Top250中唯一一部动画片,它讲述了一个关于成长和勇气的奇幻故事。
7. 《泰坦尼克号》:这部由詹姆斯·卡梅隆执导的电影以其浪漫的爱情故事和逼真的特效而成为经典之作。
8. 《辛德勒的名单》:这部由史蒂文·斯皮尔伯格执导的电影根据真实事件改编,讲述了一位德国商人在二战期间拯救犹太人的故事。
9. 《盗梦空间》:这部由克里斯托弗·诺兰执导的科幻电影以其复杂的剧情和令人惊叹的视觉效果而备受赞誉。
10. 《忠犬八公的故事》:这部由拉斯·霍尔斯道姆执导的电影根据真实事件改编,讲述了一只忠诚的狗与主人之间的感人故事。
相关问题
豆瓣电影top250爬虫代码request豆瓣电影top250爬虫代码request
豆瓣电影Top250的爬虫代码通常涉及到使用Python的requests库发送HTTP请求,然后解析HTML内容来提取需要的信息。以下是一个简单的Python爬虫示例,使用BeautifulSoup库来解析数据:
```python
import requests
from bs4 import BeautifulSoup
def get_douban_top250():
url = "https://movie.douban.com/top250"
# 发送GET请求
response = requests.get(url)
# 检查请求状态码
if response.status_code == 200:
# 解析HTML
soup = BeautifulSoup(response.text, 'lxml')
# 找到电影列表元素
movie_list = soup.select('.hd')
# 提取每个电影的数据(如名称、评分)
movies = []
for movie in movie_list:
title = movie.find('span', class_='title').text.strip()
rating = float(movie.find('span', class_='rating_num').text)
movies.append((title, rating))
return movies
else:
print(f"请求失败,状态码:{response.status_code}")
return None
# 使用爬虫
movies = get_douban_top250()
if movies:
for i, (title, rating) in enumerate(movies, start=1):
print(f"{i}. {title}: {rating}/10")
python爬取豆瓣电影top250并保存为xlsx_【python】Python爬豆瓣电影top250导出Excel
好的,以下是Python代码实现:
```python
import requests
from bs4 import BeautifulSoup
import openpyxl
# 发送请求并获取页面内容
def get_html(url):
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.146 Safari/537.36'
}
response = requests.get(url, headers=headers)
response.encoding = 'utf-8'
html = response.text
return html
# 解析页面内容,并返回数据
def parse_html(html):
soup = BeautifulSoup(html, 'html.parser')
movie_list = soup.find('ol', class_='grid_view').find_all('li')
data = []
for movie in movie_list:
title = movie.find('div', class_='hd').find('span', class_='title').get_text() # 电影名称
star = movie.find('div', class_='star').find('span', class_='rating_num').get_text() # 评分
quote = movie.find('span', class_='inq').get_text() if movie.find('span', class_='inq') else '' # 引言
data.append((title, star, quote))
return data
# 保存数据到Excel文件
def save_to_xlsx(data, filename):
workbook = openpyxl.Workbook()
sheet = workbook.active
sheet.title = '豆瓣电影Top250'
sheet.cell(row=1, column=1, value='电影名称')
sheet.cell(row=1, column=2, value='评分')
sheet.cell(row=1, column=3, value='引言')
for i, item in enumerate(data):
sheet.cell(row=i+2, column=1, value=item[0])
sheet.cell(row=i+2, column=2, value=item[1])
sheet.cell(row=i+2, column=3, value=item[2])
workbook.save(filename)
if __name__ == '__main__':
url = 'https://movie.douban.com/top250'
html = get_html(url)
data = parse_html(html)
save_to_xlsx(data, '豆瓣电影Top250.xlsx')
```
这段代码会爬取豆瓣电影Top250的数据,并将数据保存到Excel文件中。你只需要将代码复制到Python文件中,然后在终端中运行即可。Excel文件会保存在当前目录下。
阅读全文