python爬虫怎么翻页
时间: 2023-07-12 12:59:46 浏览: 80
在Python中,爬取翻页数据的最常见的方法是使用循环迭代。一般来说,我们可以通过改变URL中的页码参数来获取不同页面的数据。以下是一个示例代码,可以爬取翻页数据:
```python
import requests
from bs4 import BeautifulSoup
url = 'https://www.example.com/page='
page = 1
while True:
# 构造当前页的URL
page_url = url + str(page)
# 发送请求
response = requests.get(page_url)
# 解析HTML页面
soup = BeautifulSoup(response.text, 'html.parser')
# 提取数据
data = soup.find_all('div', {'class': 'data'})
# 处理数据
for item in data:
# 处理每一条数据
pass
# 判断是否到达最后一页
if soup.find('a', {'class': 'next'}) is None:
break
# 进入下一页
page += 1
```
在这个示例中,我们首先定义了一个URL和起始页码,然后使用一个while循环来不断发送请求和解析HTML页面。在处理完当前页的数据后,我们判断页面中是否存在“下一页”的链接,如果有的话就继续翻页,否则就退出循环。在进入下一页之前,需要将页码加1,以便构造下一页的URL。
阅读全文