用python爬取豆瓣读书网中评论人数存储到mongodb中的数据怎么转换为int类型
时间: 2024-02-13 12:05:09 浏览: 76
您可以使用Python中的字符串处理和类型转换函数来实现这个过程。具体来说,您可以使用Python中的`pymongo`库来连接MongoDB数据库,然后使用`find()`函数获取评论数据,遍历每个文档并使用`int()`函数将评论人数转换为整数类型,最后使用`update_one()`函数将数据更新到MongoDB中。
以下是一个可能的代码示例:
```python
import pymongo
# 连接MongoDB数据库
client = pymongo.MongoClient("mongodb://localhost:27017/")
db = client["mydatabase"]
collection = db["book_ratings"]
# 获取评论数据
comments = collection.find()
# 遍历每个评论文档,并将评论人数转换为整数类型
for comment in comments:
rating_count = comment["rating_count"]
rating_count = int(rating_count.strip("人评价").replace(",", ""))
# 将更新后的评论人数更新到MongoDB中
collection.update_one({"_id": comment["_id"]}, {"$set": {"rating_count": rating_count}})
```
这个代码示例将连接到MongoDB数据库,获取名为`book_ratings`的集合中的所有评论文档,然后使用`strip()`函数删除评论人数中的“人评价”字符,并使用`replace()`函数将千位分隔符去除。最后,使用`int()`函数将评论人数转换为整数类型,并使用`update_one()`函数将更新后的数据更新到MongoDB中。
请根据您的数据格式和处理需求修改这个示例代码。
阅读全文