首页爬取豆瓣电影top500的电影数据代码

爬取豆瓣电影top500的电影数据代码

时间: 2023-09-13 12:08:27 浏览: 131

好的，以下是Python代码： ```python import requests from bs4 import BeautifulSoup url = 'https://movie.douban.com/top250' movies = [] for i in range(0, 250, 25): res = requests.get(url, params={'start': i, 'filter': ''}) soup = BeautifulSoup(res.text, 'html.parser') movie_list = soup.find('ol', class_='grid_view').find_all('li') for movie in movie_list: title = movie.find('span', class_='title').text rating_num = movie.find('span', class_='rating_num').text comment_num = movie.find('div', class_='star').find_all('span')[3].text[:-3] quote = movie.find('span', class_='inq').text if movie.find('span', class_='inq') else '' movies.append({'title': title, 'rating_num': rating_num, 'comment_num': comment_num, 'quote': quote}) for movie in movies: print(movie) ``` 这个代码可以爬取豆瓣电影 top250 的电影数据，包括电影名称、评分、评论数和简介。如果需要爬取 top500 的电影数据，只需要将 `url` 修改为 `'https://movie.douban.com/top250?start=250&filter='`，然后将循环中的 `range(0, 250, 25)` 修改为 `range(250, 500, 25)` 即可。

阅读全文