python爬取b站视频评论
时间: 2023-10-08 13:10:48 浏览: 77
要爬取B站视频评论,可以使用Python中的requests和beautifulsoup库。以下是一个简单的例子:
首先,我们需要找到要爬取评论的视频页面,并复制视频的AV号。
然后,我们可以使用以下代码来获取评论数据:
```python
import requests
from bs4 import BeautifulSoup
av_number = 'AV号' # 替换为要爬取的视频的AV号
url = f'https://www.bilibili.com/video/{av_number}/'
# 发送请求,获取页面内容
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
# 查找评论元素
comments = soup.find_all('div', {'class': 'comment'})
# 提取评论内容
for comment in comments:
content = comment.find('div', {'class': 'text'}).text.strip()
print(content)
```
这段代码使用requests库发送GET请求,然后使用beautifulsoup库解析页面内容。我们通过查找“comment”类的div元素来获取评论,并从每个评论中提取出评论内容。
注意:为了避免被B站反爬虫机制限制,我们需要在请求头中添加一些信息,使其看起来像是一个普通的用户在浏览网页。可以将以下代码添加到请求头中:
```python
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36 Edge/16.16299',
'Referer': url,
'Cookie': 'SESSDATA=xxxxxxxxxx; bili_jct=xxxxxxxxxx;'
}
response = requests.get(url, headers=headers)
```
其中,User-Agent代表浏览器的信息,Referer则表示当前请求来源,Cookie是用户的登录信息。你需要将Cookie和Referer替换为你自己的信息。
阅读全文