python爬取微博代码
时间: 2023-09-30 11:09:32 浏览: 30
以下是一个基本的 Python 爬取微博的示例代码:
```python
import requests
from bs4 import BeautifulSoup
# 设置请求头
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
# 模拟登录
session = requests.session()
login_url = 'https://passport.weibo.cn/signin/login'
data = {
'username': 'your_username',
'password': 'your_password',
'savestate': '1',
'r': '',
'ec': '0',
'pagerefer': '',
'entry': 'mweibo',
'wentry': '',
'loginfrom': '',
'client_id': '',
'code': '',
'qq': '',
'mainpageflag': '1',
'hff': '',
'hfp': ''
}
session.post(login_url, headers=headers, data=data)
# 爬取微博页面
url = 'https://m.weibo.cn/api/container/getIndex?uid=your_uid&luicode=10000011&lfid=your_lfid&type=uid&value=your_value&containerid=your_containerid&page=1'
response = session.get(url, headers=headers)
content = response.content.decode('utf-8')
soup = BeautifulSoup(content, 'html.parser')
# 解析微博内容
for card in soup.select('.weibo-card'):
print(card.text)
```
需要注意的是,爬取微博需要模拟登录,这里使用了 requests 库和 session,同时需要填写自己的用户名、密码、uid、lfid、value、containerid 等信息。另外,微博的页面结构可能会有变化,需要根据实际情况做出相应的调整。
相关推荐
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)