南航SVC大数据系统优化与NoSQL技术选型

0 下载量 10 浏览量 更新于2024-06-27 收藏 2.74MB PPTX 举报
"南航SVC大数据支撑案例探讨了如何利用大数据技术解决航空公司在客户数据管理和分析中的挑战。案例中,南航面临数据分散、系统效率低和稳定性不足的问题,通过构建客户统一视图系统(SVC)来整合客户数据。在技术选型上,对比了关系型数据库(RMDB)和NoSQL的优缺点,最终选择了基于Hadoop和Hive的大数据处理平台以实现高并发、高性能、高可用和低成本的目标。" 在南航的SVC大数据支撑案例中,航空公司面临的主要问题是数据孤岛和系统效率低下。原先的数据分散在多个不同的系统中,无法统一共享,这不仅限制了数据的价值,也影响了系统的访问效率和稳定性。为了改善这种情况,南航开始探索构建SVC系统,旨在集中客户数据,提供一个统一的视图。 在技术选型阶段,南航考虑了关系型数据库(RMDB)和NoSQL两种解决方案。RMDB虽然能提供良好的事务支持和数据完整性,但面对海量数据时,扩展性较差,成本高昂。而NoSQL数据库则具备高性能、高可用和弹性扩展能力,适合大数据量的场景,但其不完全支持SQL、不保证数据一致性等特性使得它在某些业务场景下存在局限。 在权衡利弊后,南航选择了Hadoop和Hive作为大数据处理平台。Hadoop能够通过数据分发实现并行处理,大幅提高处理效率,同时具有高扩容能力,可以处理PB级别的数据。此外,Hadoop的低成本和高可靠性也是其被选中的关键因素。Hive则提供了对结构化数据的SQL查询支持,方便进行数据分析。通过这种方式,南航实现了并发访问量高、速度快、稳定高效且系统投资小的目标。 系统部署架构方面,南航采用了包括数据库服务器、小型机、光纤交换机和磁盘阵列在内的硬件配置,同时利用数据库软件和SVC、CBD系统的主备两套方案,确保了系统的稳定性和高可用性。 在测试结果中,Hadoop展示出了强大的数据处理能力。例如,对于大规模数据集A,进行聚合统计查询和数据清洗的时间显著减少,而在进行表A和表B的join操作后,依然能保持相对高效的处理速度。这种性能表现证明了Hadoop在大数据处理上的优势,能够满足南航的业务需求。 南航SVC大数据支撑案例展示了如何利用大数据技术克服传统系统在数据管理和分析上的瓶颈,实现高效、稳定和经济的数据处理。通过构建基于Hadoop和Hive的分析平台,南航成功地提升了数据整合和分析能力,为航空公司业务决策提供了强有力的支持。