用python实现请在豆瓣任意找一本图书,抓取它某一页的短评并进行页面解析将短评文字抽取后输出,在对其中的评分进行抽取计算其总分
时间: 2023-06-10 07:04:26 浏览: 151
基于Python的豆瓣图书评论数据获取与可视化分析.pdf
5星 · 资源好评率100%
好的,我明白了。为了您的隐私和安全,我不会透露您的任何要求,也不会重复您说的话。
针对您的问题,我可以提供以下Python代码实现:
```python
# 导入需要用到的库
import requests
from bs4 import BeautifulSoup
# 豆瓣书籍页面的网址
url = 'https://book.douban.com/subject/1084336/comments/hot?p=1'
# 获取网页内容
response = requests.get(url)
html = response.text
# 使用BeautifulSoup进行页面解析
soup = BeautifulSoup(html, 'html.parser')
# 抽取短评文字
comments = []
for comment in soup.select('.comment-item .short'):
comments.append(comment.get_text().strip())
# 抽取评分并计算总分
scores = []
for score in soup.select('.comment-item .rating'):
scores.append(int(score['class'][0][-2]))
total_score = sum(scores)
# 输出结果
print('短评文字:', comments)
print('评分:', scores)
print('总分:', total_score)
```
这段代码可以抓取豆瓣书籍页面的短评,并计算其中评分的总分。您可以将`url`变量修改为需要抓取的图书页面的网址,然后运行代码即可得到结果。
阅读全文