首页python滚动爬虫

python滚动爬虫

时间: 2023-11-16 11:04:45 浏览: 117

滚动爬虫是一种爬取动态网页数据的方法，可以通过模拟用户滚动页面的操作，实现获取更多数据的目的。下面是一个简单的Python滚动爬虫的例子： ```python import requests import json url = 'https://feed.mix.sina.com.cn/api/roll/get?pageid=153&lid=2509&k=&num=50&page={}' headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} data_list = [] for i in range(1, 3): # 爬取前2页数据 res = requests.get(url.format(i), headers=headers) data = json.loads(res.text)['result']['data'] for item in data: data_list.append(item['title']) print(data_list) ``` 这个例子中，我们使用requests库发送HTTP请求，模拟用户滚动页面的操作，获取新浪新闻滚动页面的数据。具体来说，我们通过修改URL中的page参数，来获取不同页数的数据。然后，我们使用json库解析返回的JSON格式数据，提取出每条新闻的标题，并将其存储在一个列表中。

阅读全文