python爬虫爬取微博评论
时间: 2023-10-11 16:07:49 浏览: 88
要爬取微博评论,可以使用 Python 的 `requests` 库和 `beautifulsoup4` 库来获取和解析页面。以下是一个简单的示例:
```python
import requests
from bs4 import BeautifulSoup
url = 'https://weibo.com/xxxxxx/xxxxxxxxx' # 微博评论页面的 URL
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
response = requests.get(url, headers=headers)
soup = BeautifulSoup(response.text, 'html.parser')
comments = [] # 存储评论的列表
comment_items = soup.select('.list_li.S_line1.clearfix')
for item in comment_items:
comment = {}
comment['user'] = item.select('.WB_text a')[0].text # 评论用户
comment['content'] = item.select('.WB_text[node-type="comment_content"]')[0].text.strip() # 评论内容
comments.append(comment)
print(comments)
```
需要注意的是,要爬取微博评论需要登录账号,可以使用模拟登录的方式或者使用 cookies。此外,微博评论是动态加载的,可以使用浏览器开发者工具查看请求的接口和参数,然后模拟请求获取评论数据。
阅读全文