优化中国太保Greenplum数据库性能策略

需积分: 21 15 下载量 158 浏览量 更新于2024-07-19 收藏 184KB DOCX 举报
本文档是中国太平洋保险针对其Greenplum数据库平台进行的一次系统调优总结,由易安信电脑系统(中国)有限公司于2013年3月20日发布。调优背景是由于部分新应用上线后,系统性能下降和function执行速度变慢。调优是在一个2+12节点的GP集群环境中进行,集群已存储大量生产数据(28TB),但未广泛使用压缩表和分区表。 调优的主要内容包括: 1. **调优需求**:系统性能问题主要表现为在多任务并行时响应延迟和夜间并发时function执行缓慢,白天单任务时性能较好。 2. **调优时间安排**:调优分为三个阶段,每个阶段持续一周,从2月18日至25日。第一阶段主要针对发现的问题进行初步诊断。 3. **执行计划分析**: - **不同时期执行计划比较**:通过对不同时间点的执行计划对比,找出性能瓶颈。 - **差异原因分析**:对计划差异进行深入剖析,可能涉及SQL查询优化、索引选择或主键约束设置等。 - **调优原则**:强调了根据业务需求和系统特性制定的优化策略,如避免全表扫描、合理使用索引等。 4. **分布键选择与优化**: - **调优前/后效率**:评估调整前后的性能提升。 - **SQL优化示例**:提供具体的SQL语句优化实例。 - **效率分析**:通过实测数据展示优化效果。 - **调优方案**:给出针对性的优化措施。 - **调优原则**:再次强调了优化的原则,如选择合适的分布键以提升数据分布均匀性。 5. **索引、主键约束**:同样进行了优化,包括效率提升、SQL调整和原则说明。 6. **分区表规划**: - **调优前/后效率**:分区表的优化对性能的影响。 - **SQL示例**:展示了如何利用分区表进行查询加速。 - **效率分析**:对比分区前后的查询性能。 - **调优方案**:针对分区表的调整策略。 - **调优原则**:分区表应根据数据访问模式进行合理划分。 7. **关联查询效率优化**:针对查询性能瓶颈,通过SQL调整实现更快的查询速度。 8. **后续优化建议**: - **硬件问题**:考虑硬件升级,如内存、CPU或I/O性能的提升。 - **磁盘空间回收**:清理不必要的数据以释放磁盘资源。 - **分布键调整**:动态监控并适时调整分布键。 - **分区表建立**:根据业务变化和查询模式创建或调整分区表。 本文档详尽地介绍了在特定环境下如何进行Greenplum数据库的系统调优,通过实例分析和优化策略,为企业提供了一套实用的性能优化方案。
2019-06-14 上传
Greenplum 集群之间同步数据方法及性能.....................................................................................1 1 概述.................................................................................................................................................2 2 相同集群相同数据库不同 SCHEMA 之间同步数据....................................................................2 2.1 查看原始表的大小行数与结构......................................................................................... 2 2.2 同步语句..............................................................................................................................2 2.3 查看 cpu 与内存的使用情况..............................................................................................3 2.3.1 查看 Master CPU 与内存使用情况.........................................................................3 2.3.2 查看数据节点的 CPU 使用情况..............................................................................3 2.3.3 查看数据节点的内存与磁盘使用情况..................................................................6 2.4 查看耗时与表的大小..........................................................................................................7 3 相同集群不同数据库之间同步数据.............................................................................................8 3.1 使用 pg_dum 方式同步数据..............................................................................................8 3.1.1 查看原始表的信息...................................................................................................8 3.1.2 把数据下载到磁盘...................................................................................................9 3.1.2.1 下载数据语句............................................................................................... 9 3.1.2.2 查看 Master 节点详细信息.........................................................................9 3.1.3 把数据导入到数据库中........................................................................................ 10 3.1.3.1 导入数据库语句......................................................................................... 10 3.1.3.2 查看 Master 节点的详细信息...................................................................11 3.1.3.3 查看数据节点的详细信息.........................................................................11 3.1.4 验证数据的准确性................................................................................................ 13 3.1.5 pg_dump 同步数据总结........................................................................................13 3.2 使用 dblink 同步数据........................................................................................................13 3.2.1 dblink 同步相同集群不同数据库的数据.............................................................13 3.2.1.1 同步语句......................................................................................................13 3.2.1.2 查看 Master 节点的详细信息...................................................................15 3.2.1.3 查看数据节点的详细信息.........................................................................15 3.2.2 验证数据的准确性................................................................................................ 17 3.2.3 dblink 使用总结......................................................................................................17 3.3 使用 gptransfer 同步数据.................................................................................................17 3.3.1 gptransfer 介绍.......................................................................................................17 3.3.2 gptransfer 命令参数介绍.......................................................................................18 3.3.3 查看集群及硬件信息............................................................................................ 19 3.3.4 同集群之间同步数据............................................................................................ 19 3.3.4.1 查看表的详细信息..................................................................................... 19 3.3.4.2 进行表数据同步......................................................................................... 19 3.3.4.3 查看硬件详细信息..................................................................................... 21 3.3.4.4 查看数据的准确性..................................................................................... 23 3.3.4.5 使用 gptransfer 总结...................................................................................23 3.3.5 不同集群之间同步数据........................................................................................ 24