python爬取微博认证信息代码
时间: 2023-10-04 18:09:21 浏览: 164
以下是一个基于 Python 的微博认证信息爬取示例代码:
```python
import requests
from bs4 import BeautifulSoup
url = 'https://weibo.com/xxx' # 将 xxx 替换为你想要爬取的微博用户名或用户ID
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
response = requests.get(url, headers=headers)
soup = BeautifulSoup(response.text, 'html.parser')
verified_info = soup.find('i', {'class': 'W_icon icon_approve'}).previous_sibling.strip()
print(verified_info)
```
解释一下代码:
1. 首先我们需要导入 `requests` 和 `BeautifulSoup` 库来进行网络请求和 HTML 解析。
2. 将微博用户名或用户ID替换到 `url` 变量中。
3. 设置请求头,伪装成浏览器发送请求。
4. 发送 GET 请求获取页面 HTML。
5. 使用 `BeautifulSoup` 解析 HTML。
6. 查找 HTML 中认证信息所在的标签,并提取出认证信息。
7. 输出认证信息。
需要注意的是,该代码只能获取到普通认证信息,无法获取到微博个人认证和企业认证等高级认证信息。
阅读全文