python滚动爬虫
时间: 2023-11-16 11:04:45 浏览: 117
滚动爬虫是一种爬取动态网页数据的方法,可以通过模拟用户滚动页面的操作,实现获取更多数据的目的。下面是一个简单的Python滚动爬虫的例子:
```python
import requests
import json
url = 'https://feed.mix.sina.com.cn/api/roll/get?pageid=153&lid=2509&k=&num=50&page={}'
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
data_list = []
for i in range(1, 3): # 爬取前2页数据
res = requests.get(url.format(i), headers=headers)
data = json.loads(res.text)['result']['data']
for item in data:
data_list.append(item['title'])
print(data_list)
```
这个例子中,我们使用requests库发送HTTP请求,模拟用户滚动页面的操作,获取新浪新闻滚动页面的数据。具体来说,我们通过修改URL中的page参数,来获取不同页数的数据。然后,我们使用json库解析返回的JSON格式数据,提取出每条新闻的标题,并将其存储在一个列表中。
阅读全文