python爬取百度贴吧页数
时间: 2023-10-07 20:08:20 浏览: 150
python爬取百度贴吧前1000页内容(requests库面向对象思想实现)
5星 · 资源好评率100%
您好,以下是可以使用的 Python 代码来获取百度贴吧的页数:
```python
import requests
from bs4 import BeautifulSoup
# 贴吧 URL
url = 'https://tieba.baidu.com/f?kw=python&ie=utf-8'
# 获取 HTML 页面
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
# 获取总页数
total_page = soup.find_all('a', {'class': 'last pagination-item'})[0].get('href').split('=')[-1]
print('总页数:', total_page)
```
在上面的代码中,我们使用 `requests` 库来获取百度贴吧的 HTML 页面,然后使用 `BeautifulSoup` 库来解析 HTML 页面。我们找到最后一页的链接,然后从链接中提取总页数。
注意:这里的代码只适用于特定的贴吧,如果您想要获取其他贴吧的页数,需要更改 `url` 变量中的贴吧名字。
阅读全文