如何爬取豆瓣书籍评价人数
时间: 2024-04-01 20:35:41 浏览: 47
要爬取豆瓣书籍评价人数,你可以使用Python编写代码,通过网络请求获取豆瓣书籍的页面源代码,然后使用正则表达式或者BeautifulSoup等库解析HTML文档,获取评价人数的信息。以下是一个简单的示例代码:
```python
import requests
from bs4 import BeautifulSoup
# 豆瓣书籍页面的URL
url = 'https://book.douban.com/subject/1084336/'
# 发送GET请求获取页面源代码
response = requests.get(url)
# 使用BeautifulSoup解析HTML文档
soup = BeautifulSoup(response.text, 'html.parser')
# 找到评价人数的标签
rating_tag = soup.find('span', attrs={'property': 'v:votes'})
# 获取评价人数的文本
rating_text = rating_tag.text
# 输出评价人数
print('评价人数:', rating_text)
```
在上面的代码中,我们首先使用requests库发送GET请求获取豆瓣书籍页面的源代码,然后使用BeautifulSoup库解析HTML文档。接着,我们找到评价人数的标签,并使用text属性获取评价人数的文本信息。最后,我们输出评价人数。
相关问题
爬取豆瓣书籍评价人数去掉人评价
如果你想要去掉评价人数文本中的“人评价”字样,可以在获取评价人数文本后使用字符串替换方法(replace)将“人评价”替换为空字符串。以下是修改后的示例代码:
```python
import requests
from bs4 import BeautifulSoup
# 豆瓣书籍页面的URL
url = 'https://book.douban.com/subject/1084336/'
# 发送GET请求获取页面源代码
response = requests.get(url)
# 使用BeautifulSoup解析HTML文档
soup = BeautifulSoup(response.text, 'html.parser')
# 找到评价人数的标签
rating_tag = soup.find('span', attrs={'property': 'v:votes'})
# 获取评价人数的文本
rating_text = rating_tag.text
# 去掉评价人数文本中的“人评价”
rating_text = rating_text.replace('人评价', '')
# 输出评价人数
print('评价人数:', rating_text)
```
在修改后的代码中,我们在获取评价人数文本后使用replace方法将“人评价”替换为空字符串。最后,我们输出去掉“人评价”字样后的评价人数。
爬取豆瓣书籍评价人数如何去掉括号
您可以使用字符串函数中的replace()方法来去掉括号。具体地,可以使用如下代码:
```python
s = "(1000)" # 假设s是一个字符串,包含括号
s = s.replace("(", "").replace(")", "")
print(s) # 输出: 1000
```
这段代码中,replace()方法的作用是将字符串中的左右括号分别替换为空字符串,从而去掉括号。
阅读全文