首页帮我写一个爬虫获取豆瓣电影top250

帮我写一个爬虫获取豆瓣电影top250

时间: 2023-09-05 21:10:47 浏览: 96

好的，以下是一个使用 Python 编写的爬虫程序，可以获取豆瓣电影 Top250 的电影名称、评分和电影详情链接： ```python import requests from bs4 import BeautifulSoup url = 'https://movie.douban.com/top250' def get_movies(url): headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} response = requests.get(url, headers=headers) soup = BeautifulSoup(response.text, 'html.parser') movies_list = soup.find('ol', class_='grid_view').find_all('li') movies = [] for movie in movies_list: title = movie.find('span', class_='title').text rating = movie.find('span', class_='rating_num').text link = movie.find('a').get('href') movies.append({ 'title': title, 'rating': rating, 'link': link }) return movies movies = [] for i in range(0, 250, 25): url = f'https://movie.douban.com/top250?start={i}&filter=' movies.extend(get_movies(url)) for movie in movies: print(movie['title'], movie['rating'], movie['link']) ``` 这个程序使用 requests 库获取网页内容，使用 BeautifulSoup 库解析HTML标签，将获取到的电影信息存储在一个列表中，并最终输出电影名称、评分和电影详情链接。您可以将程序保存为 Python 文件并运行，即可获取豆瓣电影 Top250 的电影信息。

阅读全文