InnoDB引擎下count(*)性能优化：原因与解决方案

需积分: 10 193 浏览量更新于2024-07-16 收藏 1.93MB PDF 举报

在开发过程中，遇到查询大量数据表的行数变慢的问题，特别是当使用 MySQL 的 InnoDB 引擎时，一条简单的 `SELECT COUNT(*) FROM t` 语句可能不再高效。这是因为 InnoDB 采取了多版本并发控制 (MVCC) 的策略，导致在并发环境下，即使在同一时刻，表的行数也会因其他事务的插入或删除而实时变化，所以不能像 MyISAM 那样简单地将总数存储在内存中。 InnoDB 不像 MyISAM 一样预先计算并存储总行数的主要原因在于 MVCC。在 InnoDB 中，每个事务看到的数据都是基于它们开始时刻的数据版本，而不是当前的最新状态。这意味着，即使在没有 WHERE 子句的情况下，每次对 `COUNT(*)` 的查询都需要遍历整个引擎中的数据，确保返回的是当前版本下的准确行数，这在高并发场景下会带来性能开销。对于这种情况，如果你的业务需求确实需要频繁地统计表行数，并且数据量非常大，有以下几种优化策略： 1. **预计算缓存**：在业务空闲时期，定期进行全表扫描并更新缓存中的行数。这样可以减少查询时的实时计算，但需考虑缓存更新的同步问题和缓存失效策略。 2. **使用索引计数**：虽然 `COUNT(*)` 不直接利用索引，但你可以尝试创建一个特殊的计数列，仅用于统计目的，然后在插入或删除时更新这个列。然而，这会增加存储开销，且可能导致复杂度提高。 3. **分区表**：将大表拆分成多个物理分区，每个分区独立维护自己的行数，可以降低单个分区的查询压力，但增加管理复杂性。 4. **使用 Materialized View**：如果业务允许，可以创建 materialized view，定期更新视图的行数，但这同样需要额外的维护和资源消耗。 5. **业务设计优化**：重新评估业务逻辑，是否真的需要实时精确的行数统计，或者是否有更合适的数据聚合频率。例如，对于某些应用，每小时或每天统计一次即可满足需求，从而减少查询频率。了解 InnoDB 的内部机制有助于我们选择合适的优化策略，权衡性能与实时性之间的需求。在处理大规模并发且频繁计数的场景时，应考虑多种解决方案，根据实际情况做出决策。

你可能还记得在第 10 篇文章《 MySQL 为什么有时候会选错索引？》中我提到过，索引

统计的值是通过采样来估算的。实际上，TABLE_ROWS 就是从这个采样估算得来的，因

此它也很不准。有多不准呢，官方文档说误差可能达到 40% 到 50%。所以，show table

status 命令显示的行数也不能直接使用。

到这里我们小结一下：

那么，回到文章开头的问题，如果你现在有一个页面经常要显示交易系统的操作记录总

数，到底应该怎么办呢？答案是，我们只能自己计数。

接下来，我们讨论一下，看看自己计数有哪些方法，以及每种方法的优缺点有哪些。

这里，我先和你说一下这些方法的基本思路：你需要自己找一个地方，把操作记录表的行

数存起来。

用缓存系统保存计数

对于更新很频繁的库来说，你可能会第一时间想到，用缓存系统来支持。

你可以用一个 Redis 服务来保存这个表的总行数。这个表每被插入一行 Redis 计数就加

1，每被删除一行 Redis 计数就减 1。这种方式下，读和更新操作都很快，但你再想一下

这种方式存在什么问题吗？

没错，缓存系统可能会丢失更新。

Redis 的数据不能永久地留在内存里，所以你会找一个地方把这个值定期地持久化存储起

来。但即使这样，仍然可能丢失更新。试想如果刚刚在数据表中插入了一行，Redis 中保

存的值也加了 1，然后 Redis 异常重启了，重启后你要从存储 redis 数据的地方把这个值

读回来，而刚刚加 1 的这个计数操作却丢失了。

MyISAM 表虽然 count(*) 很快，但是不支持事务；

show table status 命令虽然返回很快，但是不准确；

InnoDB 表直接 count(*) 会遍历全表，虽然结果准确，但会导致性能问题。

加微信 ixuexi66 获取最新一手资源

剩余16页未读，继续阅读

zzqtty

粉丝: 75
资源: 6

InnoDB引擎下count(*)性能优化：原因与解决方案

MySQL数据库性能优化实战技巧PDF全集

一线数据库工程师深度解析MySQL：优化与实践

深入理解MYSQL查询实战技巧与案例源码解析

慢sql监控mysql及oracle.pdf

malloc.pdf

Hortonworks.CheatSheet.SQLtoHive.pdf

几年前，为什么我撸了一套RabbitMQ客户端？（csdn）————程序.pdf

c语言滤波算法.pdf

PHP编码技巧.pdf

rabbitmq面试题.pdf

最新资源