爬取豆瓣书籍评价人数去掉人评价
时间: 2023-08-13 13:08:39 浏览: 38
如果你想要去掉评价人数文本中的“人评价”字样,可以在获取评价人数文本后使用字符串替换方法(replace)将“人评价”替换为空字符串。以下是修改后的示例代码:
```python
import requests
from bs4 import BeautifulSoup
# 豆瓣书籍页面的URL
url = 'https://book.douban.com/subject/1084336/'
# 发送GET请求获取页面源代码
response = requests.get(url)
# 使用BeautifulSoup解析HTML文档
soup = BeautifulSoup(response.text, 'html.parser')
# 找到评价人数的标签
rating_tag = soup.find('span', attrs={'property': 'v:votes'})
# 获取评价人数的文本
rating_text = rating_tag.text
# 去掉评价人数文本中的“人评价”
rating_text = rating_text.replace('人评价', '')
# 输出评价人数
print('评价人数:', rating_text)
```
在修改后的代码中,我们在获取评价人数文本后使用replace方法将“人评价”替换为空字符串。最后,我们输出去掉“人评价”字样后的评价人数。
相关问题
爬取豆瓣书籍评价人数如何去掉括号
您可以使用字符串函数中的replace()方法来去掉括号。具体地,可以使用如下代码:
```python
s = "(1000)" # 假设s是一个字符串,包含括号
s = s.replace("(", "").replace(")", "")
print(s) # 输出: 1000
```
这段代码中,replace()方法的作用是将字符串中的左右括号分别替换为空字符串,从而去掉括号。
豆瓣图书分析的项目说明
豆瓣图书分析项目旨在通过爬取豆瓣图书的信息,并使用数据分析技术对图书的评分、评论、标签等数据进行分析和可视化,以探索图书之间的关系、用户对图书的评价等信息。该项目包含以下几个模块:
1. 数据爬取模块:通过豆瓣API或者模拟登录爬取豆瓣图书的评分、评论、标签等信息。
2. 数据清洗模块:对爬取到的数据进行清洗和预处理,去除重复数据、处理缺失值等。
3. 数据分析模块:使用数据分析技术对清洗后的数据进行分析,包括图书之间的关系、用户对图书的评价等。
4. 可视化模块:使用可视化技术将分析结果呈现出来,包括图表、词云等。
通过该项目,可以深入了解豆瓣图书的评价和用户的阅读习惯,为读者推荐更符合自己兴趣的图书,也可以为图书出版机构提供参考和借鉴。