首页python网络爬虫豆瓣电影代码

python网络爬虫豆瓣电影代码

时间: 2023-11-09 07:06:39 浏览: 104

这段代码是一个简单的Python网络爬虫，用于爬取豆瓣电影的数据。它包含两个函数：url_parse和content_parse。url_parse函数用于获取请求地址并获取数据，content_parse函数用于解析获取到的数据并返回电影名称和评分。具体代码如下： ```python import requests from fake_useragent import UserAgent # 获取请求地址并获取数据 def url_parse(): url="https://movie.douban.com/j/search_subjects?type=movie&tag=%E8%B1%86%E7%93%A3%E9%AB%98%E5%88%86&sort=rank&page_limit=20&page_start=0" headers={"User-Agent":UserAgent().random} response=requests.get(url=url,headers=headers).json() print(response) return response # 内容解析 def content_parse(res): vedio_name=[] vedio_rate=[] content=res["subjects"] for i in content: name=i["title"] rate=i["rate"] vedio_name.append(name) vedio_rate.append(float(rate)) print(name,rate) return vedio_name ,vedio_rate ```

阅读全文