首页使用python爬虫爬取豆瓣电影top250

使用python爬虫爬取豆瓣电影top250

时间: 2023-09-02 16:05:45 浏览: 151

以下是使用Python爬虫爬取豆瓣电影Top250的代码： ```python import requests from bs4 import BeautifulSoup url = 'https://movie.douban.com/top250' headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'} movie_list = [] def get_movie(url): res = requests.get(url, headers=headers) soup = BeautifulSoup(res.text, 'html.parser') movies = soup.select('.item') for movie in movies: title = movie.select('.title')[0].text link = movie.select('.hd a')[0]['href'] rating = movie.select('.rating_num')[0].text comment = movie.select('.quote span')[0].text if movie.select('.quote span') else '' movie_list.append({'title': title, 'link': link, 'rating': rating, 'comment': comment}) next_page = soup.select('.next a') if next_page: get_movie(next_page[0]['href']) get_movie(url) for movie in movie_list: print(movie['title'], movie['rating'], movie['comment'], movie['link']) ``` 这个代码使用了requests和BeautifulSoup库，首先定义了一个URL和header，然后定义了一个空的电影列表。get_movie函数用来从每个页面中获取电影信息，包括电影名称、链接、评分和评论。如果有下一页，它会递归地调用自己，直到获取所有的电影信息。最后，通过循环遍历电影列表，输出每个电影的名称、评分、评论和链接。

阅读全文

最新推荐

使用python爬虫爬取豆瓣电影top250

相关推荐

python爬取豆瓣电影top250

python爬取豆瓣电影Top250

python爬取豆瓣top250电影

使用python爬虫爬取豆瓣电影top250的数据，并存入信息到excel和数据库.zip

用python爬虫爬取豆瓣电影top250的信息

python爬虫爬取豆瓣电影top250

python爬虫爬取豆瓣电影top250使用正则表达式

使用Python爬虫爬取豆瓣电影top100

利用python爬虫爬取豆瓣电影TOP250的数据

python爬虫爬取豆瓣读书top250书评

python爬虫爬取豆瓣读书top250书评功能实现

【python爬虫代码分享】利用python爬虫爬取豆瓣音乐top250的数据!

【python爬虫案例】利用python爬虫爬取豆瓣读书TOP250的数据！ 马哥python说

python爬虫爬取豆瓣电影top250 1、排名 No.1 3、看过人数\d+ 、想看人数 代码+csv文件

python爬虫爬取豆瓣音乐top250完整代码并连接MySQL数据库

python爬虫爬取豆瓣电影top250 1、排名 No.1 3、看过人数\d+ 、想看人数 代码+csv文件 打包 学号+姓名

python爬虫爬取豆瓣音乐top250完整代码并连接MySQL数据库实现词云图可视化

python爬虫爬取豆瓣top250

爬虫爬取豆瓣电影top250

实践Python的爬虫框架Scrapy来抓取豆瓣电影TOP250

最新推荐

yolov5s nnie.zip

基于uni-app+uview-ui开发的校园云打印系统微信小程序项目源码+文档说明

使用Java写的一个简易的贪吃蛇小游戏.zip

计算机网络概述.docx

JHU荣誉单变量微积分课程教案介绍

管理建模和仿真的文件

【实战篇：自定义损失函数】：构建独特损失函数解决特定问题，优化模型性能

如何在ZYNQMP平台上配置TUSB1210 USB接口芯片以实现Host模式，并确保与Linux内核的兼容性？

Naruto爱好者必备CLI测试应用

"互动学习：行动中的多样性与论文攻读经历"

【python爬虫案例】利用python爬虫爬取豆瓣读书TOP250的数据！马哥python说

python爬虫爬取豆瓣电影top250 1、排名 No.1 3、看过人数\d+ 、想看人数代码+csv文件

python爬虫爬取豆瓣电影top250 1、排名 No.1 3、看过人数\d+ 、想看人数代码+csv文件打包学号+姓名