用python爬取豆瓣读书网中的评分和评论人数怎么进行数据可视化分析
时间: 2023-12-23 12:02:42 浏览: 195
基于Python的豆瓣图书评论数据获取与可视化分析.pdf
5星 · 资源好评率100%
对于从豆瓣读书网中爬取下来的评分和评论人数,你可以使用 Python 中的数据可视化库来进行分析和展示,比较常用的有 Matplotlib、Seaborn 和 Plotly 等。
以下是一个使用 Matplotlib 来进行评分和评论人数可视化分析的例子:
```python
import pymongo
import matplotlib.pyplot as plt
# 连接 MongoDB 数据库
client = pymongo.MongoClient('localhost', 27017)
db = client['douban']
collection = db['books']
# 查询评分和评论人数数据
data = collection.aggregate([
{'$group': {'_id': '$rating', 'count': {'$sum': 1}}},
{'$sort': {'_id': 1}}
])
# 将数据转换为列表
x = []
y = []
for item in data:
x.append(float(item['_id']))
y.append(int(item['count']))
# 绘制柱状图
plt.bar(x, y, width=0.2)
plt.xlabel('Rating')
plt.ylabel('Count')
plt.title('Douban Book Rating')
plt.show()
```
这段代码首先连接到 MongoDB 数据库,查询评分和评论人数数据,并将数据转换为列表。然后使用 Matplotlib 绘制柱状图,展示不同评分的数量。
你也可以使用其他的数据可视化库进行分析和展示,例如 Seaborn 和 Plotly。它们的用法和 Matplotlib 类似,你可以根据实际情况选择适合自己的库来进行数据可视化分析。
阅读全文