浙江移动Hadoop详单系统优化与扩容方案(1.97版)

需积分: 10 0 下载量 106 浏览量 更新于2024-07-09 收藏 2.2MB PPTX 举报
浙江移动基于Hadoop的详单系统建设方案v1.97.pptx是一个针对浙江移动在进行大规模详单查询服务时遇到的问题及其解决方案的专业文档。该方案旨在解决以下几个关键问题: 1. **性能瓶颈与查询失败**: 当查询的数据量超过10,000条时,系统性能受限,导致查询服务无法处理大量数据,从而引发查询失败。这表明了对大数据量处理能力的需求,以及现有系统在数据量处理上的不足。 2. **共享内存管理**: 详单查询应用依赖于共享内存来存储中间数据,但当内存数据量达到5千万条时,会写入详单文件,这可能导致查询服务因内存竞争而阻塞。此外,如果导入应用出现故障,查询应用可能无法正常获取内存信号量,影响整体服务稳定性。 3. **应用部署与耦合度**: 当前的部署架构中,详单查询、预处理和导入应用紧密关联,部署在同一台主机上,这可能导致资源竞争加剧和应用间的性能互相影响。系统设计缺乏高可用性和过载保护机制。 4. **资源集中与竞争**: 系统的主机资源分配不够均衡,主机间的业务和号段划分没有充分利用分布式特性,导致资源竞争严重。缺乏专门的高可用性保障措施,使得系统在查询服务量大时难以应对。 5. **存储空间管理**: 实时详单、历史详单和中间文件分别占据不同的存储空间,但总体存储利用率较高,特别是实时详单文件系统已达75%饱和状态。计费原始详单和中间过程文件仅保留3天数据,以节省空间,但这也限制了查询文件的长期存储。 6. **未来挑战与优化方向**: 随着业务的增长,单个文件系统的容量成为瓶颈,需要考虑采用分布式存储系统和数据分片技术,提高系统的扩展性和容错能力,同时增强系统高可用性和性能。 这份方案旨在通过引入Hadoop这样的大数据处理框架,改善现有的详单查询性能,提升系统扩展性和容错性,降低存储空间压力,并优化应用部署和通信机制,以适应浙江移动日益增长的业务需求。