提升666倍性能：TiDB索引优化实战揭秘

版权申诉

36 浏览量更新于2024-08-07 收藏 567KB DOC 举报

在这个关于在TiDB中正确使用索引的小案例中，作者分享了一个实际项目经验，涉及到一个物流系统的性能优化。系统原先是基于MySQL开发的，后来迁移至TiDB进行测试，业务数据量较大，包含10个库和约900张表，最大的单表有6千万多行。迁移过程顺利，但在TiDB环境中，发现一条SQL语句频繁出现在慢查询列表中，即使看起来是个简单的单表查询，但执行时间却高达1.2秒，其中大部分时间（约666倍）耗费在Coprocessor的数据扫描上。 SQL查询涉及31个字段，其查询条件包括group_id、cur_thread、pre_exectime等字段。原始SQL和执行计划显示，没有有效的索引来加速搜索，导致TiDB不得不对整个表进行全表扫描，效率低下。在TiDB中，索引对于大规模数据的查询性能至关重要。正确的索引设计可以显著减少数据扫描的范围，从而提升查询速度。对于这种情况，如果在job_cm_data表中的某些字段经常作为搜索条件出现，应该考虑创建这些字段的索引。例如，可以为`group_id`、`cur_thread`等字段建立覆盖索引，使得查询只需基于索引就能获取所需结果，避免了全表扫描。创建索引可以遵循以下步骤： 1. 分析查询模式：确定哪些字段经常被用于WHERE子句的条件。 2. 选择合适的索引类型：B-Tree索引适合大多数情况，但如果存在范围查询或部分匹配，InnoDB的全文索引或哈希索引可能更合适。 3. 考虑覆盖索引：如果索引包含了查询所需的全部数据，查询可以直接在索引上完成，无需回表，进一步提高性能。 4. 避免过度索引：创建过多索引会增加存储开销和维护成本，应仅针对常见查询路径创建必要的索引。在这个案例中，如果在job_cm_data表的特定字段上添加了合适的索引，预计可以大幅降低查询时间，提高系统的整体响应速度。通过调整索引策略，不仅解决了当前的性能瓶颈，还能为未来可能的增长和更多的查询场景做好准备。此外，定期监控和优化索引也是保持系统性能的关键，因为数据结构和查询需求可能会随着时间而变化。

用一个性能提升了 666 倍的小案例说明在 TiDB 中正确使用索引的重要性

背景

最近在给一个物流系统做 TiDB POC 测试，这个系统是基于 MySQL 开发的，本次投入测

试的业务数据大概 10 个库约 900 张表，最大单表 6 千多万行。

这个规模不算大，测试数据以及库表结构是用 Dumpling 从 MySQL 导出，再用 Lightning

导入到 TiDB 中，整个过程非常顺利。

系统在 TiDB 上跑起来后，通过 Dashboard 观察到有一条 SQL 非常规律性地出现在慢查询

页面中，打开 SQL 一看只是个单表查询并不复杂，感觉必有蹊跷。

问题现象

以下是从 Dashboard 中抓出来的原始 SQL 和执行计划，总共消耗了 1.2s，其中绝大部分

时间都花在了 Coprocessor 扫描数据中：

SELECT {31 个字段}

FROM

job_cm_data

WHERE

(

group_id = ‘GROUP_MATERIAL’

AND cur_thread = 1

AND pre_excutetime

id task estRows operator info

actRows execution info

memory disk

下载后可阅读完整内容，剩余9页未读，立即下载

书博教育

粉丝: 1
资源: 2837

提升666倍性能：TiDB索引优化实战揭秘

简单了解 TiDB 架构.doc

PingCAP《TiDB中文手册》（2021.04.14）

在openeuler上体验tidb离线安装、升级.doc

TiDB 的正确使用姿势1

TiDB 中文手册tidb-stable-zh-manual.pdf

tidb.tar.gz

tidb中文手册.pdf

TiDB中文技术手册.pdf

tidb

TiDB在金融行业的创新实践.pdf

最新资源