面向操作应用的大数据管理:关系数据库与新技术

需积分: 23 0 下载量 158 浏览量 更新于2024-08-23 收藏 1.91MB PPT 举报
本章节来自《数据库系统概论》(第五版)的第14章——大数据管理,探讨了在DT时代的背景下,大数据对操作型应用关系数据库技术的影响和发展。首先,作者强调了大数据的重要性,提及了马云的观点,即大数据和大算力是推动世界前进的关键动力,特别是在处理海量数据、5G物联网和芯片技术进步的背景下。 在14.1节大数据概述中,对大数据的定义进行了深入阐述。大数据最初指的是非常大规模的数据库(VLDB),其数据量远超百万条记录,这一概念源于20世纪70年代。当时的数据库管理系统(DBMS)技术,如三级模式结构、数据独立性、关系数据理论等,为后来的大数据管理和分析奠定了基础。随着21世纪初“海量数据”概念的提出,数据规模进一步扩大,不仅包括结构化数据,还涉及半结构化和非结构化数据的处理,这要求数据库技术能够有效管理这些复杂的数据类型和集成多数据源。 2008年,《Science》杂志的一篇文章定义了大数据,指出当数据规模超出当时计算机处理能力时,就需要新的技术和方法来存储、管理和分析。大数据不再是一个时代的特有产物,而是随社会和技术进步而不断发展的重要领域。面向操作型应用的关系数据库技术,如基于行存储的系统、并行数据库系统和内存数据库系统,都努力在保持数据一致性、精确度和恢复性的同时,提升扩展性和性能,以适应大数据时代的挑战。 此外,NewSQL系统如VoltDB的出现,结合了传统数据库的ACID特性(原子性、一致性、隔离性、持久性)和NoSQL的扩展性,成为适用于OLTP应用的新型数据管理系统。这些系统在处理大数据场景中的角色越来越关键,它们通过不断的技术创新和优化,确保了在DT时代下高效、稳定地支持业务运作。 本章内容涵盖了大数据的概念、特征、管理系统的演变以及它们如何影响面向操作型应用的关系数据库技术,突显了在数据驱动的DT时代,数据库系统在处理和分析海量数据中的核心作用。