MongoDB实战技巧：分布式集群下的数据统计与管理

146 浏览量更新于2024-08-30 收藏 124KB PDF 举报

"MongoDB使用小结：一些不常见的经验分享" MongoDB是一个广泛使用的开源文档数据库系统，尤其适合处理大规模数据。在实际操作中，有几点需要注意，这将有助于优化性能和确保数据的准确性。 1. **count统计结果错误**：在分布式集群环境中，直接使用`count`命令获取文档数量可能会因为孤儿文档或块迁移导致不准确的结果。为得到精确计数，应使用`aggregate`管道方法，如： ```javascript db.collection.aggregate([{$group:{_id:null, count:{$sum:1}}]}) ``` 这种方法能够确保在分布式集群中的数据统计准确。 2. **数字类型转换**： MongoDB的Shell中，默认数字类型为双精度浮点数（float）。因此，即使在更新时不改变文档中的整数值，再次写回时，该整数会被转换为浮点数。为了避免这种情况，需要特别注意数据类型的操作。 3. **索引重建策略**：当使用`mongorestore`恢复数据到新数据库时，不应预先创建索引。`mongorestore`工具会在数据恢复完成后自动根据备份文件中的索引信息重建，这样做可以提高性能。如果需要更改索引结构，应在数据完全导入后再进行。 4. **命名空间（namespace）限制**： MongoDB的每个数据库都有一个名为`dbname.ns`的文件，用于存储所有的集合（collection）名。当集合数量超过该文件所能容纳的限制时，会出现无法创建新集合的错误。通常，一个16MB的`dbname.ns`文件可以支持大约36000个集合（具体数量可能因索引大小而异）。如果需要更多集合，可以通过调整数据库的`nssize`参数来扩大`dbname.ns`文件的大小。 5. **监控和管理**：可以使用`db.system.namespaces.count()`命令来检查当前数据库中的集合数量。如果遇到“hash table namespace index max chain reached”错误，表明命名空间已满，需要增大`nssize`或者清理不再使用的集合。在MongoDB的实际操作中，理解这些细节是非常关键的，它们可以帮助避免潜在问题，提升系统的稳定性和效率。对于大型数据处理任务，尤其是涉及分布式集群的情况，了解并掌握这些经验分享是至关重要的。

MongoDB使用小结：一些不常见的经验分享使用小结：一些不常见的经验分享

最近一年忙碌于数据处理相关的工作，跟MongoDB打交道极多，以下为实践过程中的Q&A，后续会不定期更新补充。

1、count统计结果错误

这是由于分布式集群正在迁移数据，它导致count结果值错误，需要使用aggregate pipeline来得到正确统计结果，例如：

db.collection.aggregate([{$group: {_id: null, count: {$sum: 1}}}])

引用：“On a sharded cluster, count can result in an inaccurate count if orphaned documents exist or if a chunk migration is

in progress.”

2、从shell中更新/写入到文档的数字，会变为float类型

引用：“shell中的数字都被MongoDB当作是双精度数。这意味着如果你从数据库中获得的是一个32位整数，修改文档后，将文

档存回数据库的时候，这个整数也就被换成了浮点数，即便保持这个整数原封不动也会这样的。”

3、restore数据到新DB时，不要去先建索引

把bson数据文件restore到另一个DB时，需要注意：不能先创建索引再restore数据，否则性能极差，mongorestore工具默认会

在restore完数据时，根据dump出来的index信息创建索引，无须自己创建，如果是要更换索引，也应该在数据入库完之后再创

建。

4、DB中的namespace数量太多导致无法创建新的collection

错误提示：error: hashtable namespace index max chain reached:1335，如何解决呢？

这是DB中的collection个数太多导致，在实践中以每个collection 8KB计算（跟官方文档里说的不同，可能跟index有关

系），256MB可以支持36000个collection。db.system.namespaces.count() 命令可以统计当前DB内的collection数目，DB可

支持collection数量是由于nssize参数指定的，它指定了dbname.ns磁盘文件的大小，也就指定了DB可支持的最大collection数

目，ns为namespace缩写。默认nssize为16MB。

如果重启MongoD并修改了nssize参数，这新nssize只会对新加入的DB生效，对以前已经存在的DB不生效，如果你想对已经

存在的DB采用新的nssize，必须在加大nssize重启之后新建DB，然后把旧DB的collection 复制到新DB中。

namespace限制相关文档：http://docs.mongodb.org/manual/reference/limits/#Number-of-Namespaces

5、moveChunk因旧数据未删除而失败

错误日志：”moveChunk failed to engage TO-shard in the data transfer: can't accept new chunks because there are still 1

deletes from previous migration“。

意思是说，当前正要去接受新chunk 的shard正在删除上一次数据迁移出的数据，不能接受新Chunk，于是本次迁移失败。这

种log里显示的是warning，但有时候会发现shard的删除持续了十几天都没完成，查看日志，可以发现同一个chunk的删除在不

断重复执行，重启所有无法接受新chunk的shard可以解决这个问题。

如果采用了balancer自动均衡，那么可以加上_waitForDelete参数，如：

{ "_id" : "balancer", "activeWindow" : { "start" : "12:00", "stop" : "19:30" }, "stopped" : false, "_waitForDelete" : true }

这样就不会因delete堆积而导致后续migrate失败，当然，需要考虑到这里的阻塞是否会影响到程序正常运转，在实践中慎重

采用使用waitForDelete，因为发现加上它之后迁移性能非常差，可能出现卡住十几个小时的情况，外界拿住了被迁移chunk的

游标句柄，这时候删除不能执行，阻塞了后续其它迁移操作。

游标被打开而导致被迁移数据无法及时删除时的日志：

2015-03-07T10:21:20.118+0800 [RangeDeleter] rangeDeleter waiting for open cursors in: cswuyg_test.cswuyg_test,

min: { _id: -6665031702664277348 }, max: { _id: -6651575076051867067 }, elapsedSecs: 6131244, cursors: [ 220477635588 ]

这可能会卡住几十小时，甚至一直卡住，影响后续的moveChunk操作，导致数据不均衡。

解决方法还是：重启。

6、bson size不能超过16MB的限制

单个文档的BSON size不能超过16MB。find查询有时会遇到16MB的限制，譬如使用$in 查询的时候，in中的数组元素不能太

多。对一些特殊的数据源做MapReduce，MapReduce中间会将数据组合为“KEY：[VALUE1、VALUE2]”这样的格式，当value

特别多的时候，也可能会遇上16MB的限制。

下载后可阅读完整内容，剩余5页未读，立即下载

weixin_38663151

粉丝: 3
资源: 897

MongoDB实战技巧：分布式集群下的数据统计与管理

MongoDB进阶与实战：微服务整合、性能优化、架构管理.docx

MongoDB应用设计模式：MongoDB Applied Design Patterns

MongoDB实战技巧：Q&A与经验分享

MongoDB实战技巧：解决count错误与数字类型问题

运维工程师必读：网络、开发与管理实践

VSCode数据库管理轻松上手：连接与查询技巧

Parrot OS数据库安全测试：全面保护你的数据资产

从0到1构建Go微服务：架构设计与最佳实践

【编程效率提升】：屏通Panelmaster高级编程技巧揭秘

业务流程重构：集团IT蓝图的优化与创新之道

最新资源