农业银行大数据量表存储优化与迁移策略

98 浏览量更新于2024-08-31 收藏 358KB PDF 举报

"本文主要介绍了农业银行某系统在面临大数据量挑战时的迁移与优化实践。随着业务增长，系统每日交易量超过2300万笔，高峰可达2950万笔，导致数据库压力增大，影响系统性能。项目组通过增加资源、优化配置、程序优化和数据库升级等方式进行综合优化，特别是针对大表和热表的数据存储优化。文章以流程实例表和任务实例表为例，这两张表存储了大量的工作流数据。其中，任务实例表数据量达到1.2亿，成为系统中最大的表。根据执行情况，数据被分为正在运行、已结束一年内和已结束一年以上三类。为了减轻大数据对系统的影响，提出了拆分规则，建立运行表、历史表和备份表的三级存储模式，实现实时迁移和数据透明恢复。" 在大数据迁移实践中，农业银行的系统优化首先关注大表，特别是流程实例表和任务实例表。这两张表记录了系统的所有流程实例和流转记录，数据量巨大。通过对ProDBA工具获取的SQL执行情况进行分析，发现这两张表的访问压力较大。大表的数据拆分策略是基于数据的生命周期进行的。首先，区分出正在运行、已结束一年内和已结束一年以上的数据。运行中的流程数据保留在运行表，结束后实时迁移到历史表。历史表保存已结束一年内的数据，以便在必要时恢复流程。而一年以上的数据则存入备份表，因为这些数据极少需要恢复，但仍然需要保留以满足合规性要求。这种三级存储模式有效地解决了大数据对系统性能的影响。运行表保持了当前业务的流畅运行，历史表允许快速访问最近的数据，而备份表则作为长期存储，降低了活跃数据的存储压力。通过这种方式，系统在保证服务稳定性的同时，提升了数据处理效率，降低了资源开销。此外，系统还具备将历史表中的流程实例迁回运行表的功能，确保业务连续性。这一设计充分考虑了业务需求和系统的灵活性，使数据管理更加智能化和高效。总结来说，大数据迁移实践的关键在于理解数据的特性和生命周期，然后设计合适的存储策略。农业银行的案例展示了如何通过智能的数据拆分和三级存储模式来应对大数据挑战，为其他企业提供了可借鉴的经验。

weixin_38747818

粉丝: 9
资源: 893

农业银行大数据量表存储优化与迁移策略

大数据迁移实践之路.pdf

混合云大数据迁移实践.pptx

实际的大数据迁移实践，具备以下功能： 1.能够从MySQL关系型数据库将表信息迁移到Hive数据仓库； 2.能够从Hive数据仓库将表信息迁移到MySQL关系型数据库; 3.能够将MySQL数据库中的数据增量导入到Hive数据仓库。

写20篇大数据开发工程师岗位的实习周志

java学习大数据，需要学习什么

hive sql迁移spark sql在滴滴的实践

机器学习-原理、算法与应用pdf

hcia-storage v4.5 培训教材

SpringBoot国内外研究现状

对象存储s3学习手册

最新资源