怎么把从豆瓣读书网中爬取的评论人数中的人评价删除掉转换为int类型
时间: 2024-02-13 21:05:08 浏览: 144
您可以使用Python中的字符串处理和类型转换函数来实现这个过程。具体地说,您可以使用`strip()`函数删除评论人数中的人评价,并使用`int()`函数将结果转换为整数类型。
以下是一个可能的代码示例:
```python
# 假设您已经从MongoDB中获取了评论人数的字符串列表
ratings = ['1,234人评价', '567人评价', '8人评价']
# 循环遍历每个评价字符串,删除人评价并转换为整数类型
for r in ratings:
num = int(r.strip('人评价').replace(',', ''))
print(num)
```
这个代码示例将遍历字符串列表中的每个评价,使用`strip()`函数删除其中的人评价,再使用`replace()`函数将千位分隔符去除。最后,使用`int()`函数将结果转换为整数类型,并将其打印出来。
您可以根据实际情况修改这个示例代码,以适应您的数据格式和处理需求。
相关问题
用python爬取豆瓣读书网中评论人数存储到mongodb中的数据怎么转换为int类型
您可以使用Python中的字符串处理和类型转换函数来实现这个过程。具体来说,您可以使用Python中的`pymongo`库来连接MongoDB数据库,然后使用`find()`函数获取评论数据,遍历每个文档并使用`int()`函数将评论人数转换为整数类型,最后使用`update_one()`函数将数据更新到MongoDB中。
以下是一个可能的代码示例:
```python
import pymongo
# 连接MongoDB数据库
client = pymongo.MongoClient("mongodb://localhost:27017/")
db = client["mydatabase"]
collection = db["book_ratings"]
# 获取评论数据
comments = collection.find()
# 遍历每个评论文档,并将评论人数转换为整数类型
for comment in comments:
rating_count = comment["rating_count"]
rating_count = int(rating_count.strip("人评价").replace(",", ""))
# 将更新后的评论人数更新到MongoDB中
collection.update_one({"_id": comment["_id"]}, {"$set": {"rating_count": rating_count}})
```
这个代码示例将连接到MongoDB数据库,获取名为`book_ratings`的集合中的所有评论文档,然后使用`strip()`函数删除评论人数中的“人评价”字符,并使用`replace()`函数将千位分隔符去除。最后,使用`int()`函数将评论人数转换为整数类型,并使用`update_one()`函数将更新后的数据更新到MongoDB中。
请根据您的数据格式和处理需求修改这个示例代码。
MongoDB 的可视化工具对从豆瓣读书网中爬取下来的评分和评论人数进行数据可视化分析。
MongoDB 的可视化工具有很多,其中比较常用的有 Robo 3T、MongoDB Compass 和 Studio 3T 等。这里以 MongoDB Compass 为例,介绍如何对从豆瓣读书网中爬取下来的评分和评论人数进行数据可视化分析。
1. 启动 MongoDB Compass 工具,连接到本地 MongoDB 数据库。
2. 在 MongoDB Compass 工具中,选择要可视化的数据库和集合,例如在上面的例子中,选择数据库 `douban` 和集合 `books`。
3. 在 MongoDB Compass 工具中,选择 `Aggregation` 选项卡,点击 `New Pipeline` 按钮,进入聚合管道编辑页面。
4. 在聚合管道编辑页面中,输入聚合操作符,例如:
```
[
{
$group: {
_id: "$rating",
count: { $sum: 1 }
}
}
]
```
这个聚合操作符可以对评分进行分组统计,并计算每个评分的数量。
5. 点击 `Run Pipeline` 按钮,运行聚合操作符,得到结果。
6. 在 MongoDB Compass 工具中,选择 `Charts` 选项卡,点击 `New Chart` 按钮,进入图表编辑页面。
7. 在图表编辑页面中,选择图表类型和展示的数据,例如选择柱状图类型,并选择评分和数量两个字段。
8. 点击 `Create Chart` 按钮,创建图表,并在 MongoDB Compass 工具中查看数据可视化结果。
以上就是用 MongoDB Compass 工具对从豆瓣读书网中爬取下来的评分和评论人数进行数据可视化分析的方法。你可以根据实际情况,选择不同的 MongoDB 可视化工具,并根据需要进行数据可视化分析。
阅读全文