用python爬取豆瓣电影前250，并保存数据为excel格式

好的，以下是使用 Python 爬取豆瓣电影前 250 并保存数据为 Excel 格式的代码示例： ```python import requests from bs4 import BeautifulSoup import openpyxl # 获取页面内容 def get_page_content(url): headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} response = requests.get(url, headers=headers) response.encoding = 'utf-8' return response.text # 解析页面内容 def parse_page(html): soup = BeautifulSoup(html, 'lxml') movie_list = soup.find('ol', class_='grid_view').find_all('li') for movie in movie_list: rank = movie.find('em').text title = movie.find('span', class_='title').text rating = movie.find('span', class_='rating_num').text comment_num = movie.find('div', class_='star').find_all('span')[-1].text[:-3] url = movie.find('a')['href'] yield [rank, title, rating, comment_num, url] # 保存数据到 Excel 文件 def save_to_excel(filename, data): wb = openpyxl.Workbook() ws = wb.active ws.append(['排名', '电影名', '评分', '评论人数', '链接']) for row in data: ws.append(row) wb.save(filename) if __name__ == '__main__': url = 'https://movie.douban.com/top250' filename = 'douban_top250.xlsx' data = [] for i in range(10): page_url = f'{url}?start={i*25}' page_html = get_page_content(page_url) page_data = parse_page(page_html) data.extend(page_data) save_to_excel(filename, data) print(f'Saved data to {filename}.') ``` 以上代码中，我们首先定义了 `get_page_content` 函数用于获取页面内容，然后定义了 `parse_page` 函数用于解析页面内容，将电影的排名、电影名、评分、评论人数、链接等信息提取出来，使用 `yield` 关键字生成器返回每部电影的信息。接着定义了 `save_to_excel` 函数，将数据保存到 Excel 文件中。在 `main` 函数中，我们循环遍历豆瓣电影前 250 的每一页，调用 `get_page_content` 函数获取页面内容，再调用 `parse_page` 函数解析页面内容，将每页的电影信息保存到 `data` 列表中。最后调用 `save_to_excel` 函数将数据保存到 Excel 文件中。

阅读全文

用python爬取豆瓣电影前250，并保存数据为excel格式

相关推荐

python爬取豆瓣电影Top250

Python爬取豆瓣250数据保存到MySQL或者excel代码

Python爬取豆瓣top250电影数据，并导入MySQL，写入excel

python爬取豆瓣电影top250并保存为xlsx_【python】Python爬豆瓣电影top250导出Excel

python爬取豆瓣电影top250保存excel

Python 爬取豆瓣电影Top250

python爬取豆瓣电影top250并保存为xlsx_其中包括电影名称，评分，地区，评价数，时间

用python爬取豆瓣电影排名前250名解析数据，分析电影名称，明星，电影信息，电影简述，电影评论人数，上映国家，上映时间，并将数据保存为excel

python爬取豆瓣电影后怎么导出excel

爬取豆瓣top250数据并保存到Excel

python爬取豆瓣top250,数据清洗

python爬取豆瓣top250并下载图片

Python爬虫——爬取豆瓣电影Top250代码实例

如何结合Python、BeautifulSoup、urllib库来爬取豆瓣电影TOP250的数据，并将解析后的信息保存至Excel文件中？

爬取豆瓣电影top250 excel

爬取豆瓣top前250电影并储存在Excel中

python爬取豆瓣Top100存入excel

爬取豆瓣前250部电影推荐语并保存为excel文件

python爬取豆瓣Top100存入excel代码

爬取豆瓣电影top250的电影名称及评价并吧爬取的数据保存在表格文件中

最新推荐

GitHub图片浏览插件：直观展示代码中的图像

管理建模和仿真的文件

【OPPO手机故障诊断专家】：工程指令快速定位与解决

求[100，900]之间相差为12的素数对（注：要求素数对的两个素数均在该范围内）的个数

Android IPTV项目：直播频道的实时流媒体实现

"互动学习：行动中的多样性与论文攻读经历"

【OPPO手机工程模式终极指南】：掌握这些秘籍，故障排查不再难！

前端在json文件里写模板，可以换行 有空格现在在文本框的时候

机器学习在医院再入院率预测中的应用分析

关系数据表示学习

前端在json文件里写模板，可以换行有空格现在在文本框的时候