首页如何爬取豆瓣top250电影的上映国家

如何爬取豆瓣top250电影的上映国家

时间: 2023-08-30 14:12:37 浏览: 72

豆瓣的反爬措施比较严格，所以在爬取数据时需要注意一些细节，以下是一个简单的爬取豆瓣top250电影上映国家的示例代码： ```python import requests from bs4 import BeautifulSoup url = 'https://movie.douban.com/top250' headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} def get_movie_info(url): res = requests.get(url, headers=headers) soup = BeautifulSoup(res.text, 'html.parser') movie_list = soup.find('ol', class_='grid_view').find_all('li') for movie in movie_list: title = movie.find('span', class_='title').text countries = movie.find('p',class_='').text.strip().split('/')[1].split(' ')[0] print(title + ' 上映国家：' + countries) if __name__ == '__main__': for i in range(0, 250, 25): get_movie_info(url + '?start=' + str(i)) ``` 需要注意的是，豆瓣的反爬措施比较严格，建议使用代理IP和设置延时等手段来避免被封禁。同时，爬取数据需要遵守豆瓣网站的相关规定和法律法规。

阅读全文