python爬取知乎热搜_python爬取知乎
时间: 2023-06-29 14:18:55 浏览: 295
您好!要爬取知乎热搜,可以使用Python中的requests和BeautifulSoup库。具体步骤如下:
1. 导入requests和BeautifulSoup库:
```python
import requests
from bs4 import BeautifulSoup
```
2. 使用requests发送GET请求获取网页内容:
```python
url = 'https://www.zhihu.com/hot'
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
response = requests.get(url, headers=headers)
```
3. 使用BeautifulSoup解析网页内容:
```python
soup = BeautifulSoup(response.text, 'html.parser')
```
4. 找到热搜榜单的内容所在的HTML标签,并提取其中的信息:
```python
hot_list = soup.find_all('div', class_='HotItem-content')
for hot in hot_list:
title = hot.find('h2').text
url = hot.find('a')['href']
print(title, url)
```
上述代码中,我们首先使用find_all()方法找到class为"HotItem-content"的div标签,然后逐个提取出每个热搜的标题和链接,并输出到控制台。
希望这个回答能够帮到您!
阅读全文