TeradataSQL教程:关系数据库与海量数据处理

需积分: 50 4 下载量 201 浏览量 更新于2024-07-25 收藏 2.82MB PDF 举报
"Teradata是一个大型的数据库服务器,专注于并行处理和海量数据管理,支持ANSI SQL标准,适用于企业级数据仓库解决方案。Teradata最初由NCR收购,后来成为独立上市公司。TeradataSQL是其核心的数据库查询语言,提供高效的关系数据库管理和数据完整性。" Teradata是一个强大的关系数据库管理系统(RDBMS),设计用于处理海量数据,特别是Terabytes级别的数据。它的并行处理架构使得它能够同时处理来自多个客户端的查询,确保在大规模数据环境下的高效性能。Teradata可以在单个或多个节点上运行,适应不同的企业需求,无论是小型还是贯穿整个企业的分布式系统。 Teradata的主要特点包括: 1. **关系数据库**:遵循Codd博士提出的关系数据库模型,以二维表格形式存储数据,每个表格(实体)包含多个属性(字段),每个记录代表实体的一个实例。 2. **海量处理能力**:能处理数亿行数据,支持Teradata字节级别的数据存储。 3. **并行处理**:通过多处理器同时工作,处理大数据任务。 4. **单一数据库服务器**:支持多客户端同时访问,提供统一的服务。 5. **网络和主机连接**:具备与各种系统的互连性,允许跨平台操作。 6. **工业标准访问语言(SQL)**:完全支持ANSI SQL标准,使得数据操作标准化。 7. **模块化扩展**:易于管理和扩展,可根据需要添加硬件或软件资源。 8. **容错能力**:通过不同级别硬件和软件的冗余设计,保证数据的完整性和系统的可靠性。 TeradataSQL基础教程介绍了如何利用Teradata的关系数据库特性进行数据操作。第一章关系数据库基础中讲解了关系数据库模型,其中: 1.1关系数据库模型:一个关系可以看作一个二维表,由实体、属性、记录组成。如雇员表(EmployeeTable)、部门表(DepartmentTable)和工作表展示了如何组织和存储实际业务数据。表中的主键(PK)和外键(FK)用于维护数据间的关联性,如雇员表中的MANAGER和DEPARTMENT_NUMBER字段引用了其他表的主键,实现数据的引用完整性。 例如,表1-1雇员表显示了员工信息,包括员工编号(EMPLOYEE NUMBER)、上级经理编号(MANAGER EMPLOYEE NUMBER)、部门编号(DEPARTMENT NUMBER)、职位代码(JOB CODE)等,而表1-2部门表则存储了部门编号、部门名称和预算金额等信息。通过外键关联,这两个表可以联合查询,以获取关于员工及其所在部门的详细信息。 Teradata的这些特性使其成为企业级数据仓库的首选解决方案,尤其适合那些需要处理大量数据、要求高性能和稳定性的大中型企业。通过TeradataSQL,用户可以编写复杂的查询语句,进行数据的增删改查,以及进行数据分析和报告生成。
2011-07-07 上传
第一章 数据仓库基本概念 1 1.1 背景介绍 1 1.2 OLTP与OLAP 2 1.3 数据仓库系统的查询特点 3 1.4 详细数据与小结数据(DETAIL DATA与SUMMARY DATA) 5 1.5 数据仓库与数据集市(DATA WAREHOUSE与DATA MART) 7 1.6 TERADATA的出现 10 1.7 如何衡量数据仓库引擎 11 1.7.1 TPC-D 12 1.7.2 TPC-H/R 20 1.8 NCR可扩展数据仓库方法论与实施框架 22 1.8.1 NCR可扩展数据仓库方法论 22 1.8.2 NCR可扩展数据仓库框架 26 1.8.3 NCR可扩展数据仓库合作伙伴 28 第二章 TERADATA关系型数据库管理系统概要 30 2.1 TERADATA数据库的设计思想 30 2.2 TERADATA数据库的体系结构 30 2.2.1 Teradata V1/DBC体系结构 31 2.2.2 Teradata V1/NCR 3600体系结构 34 2.2.3 开放的Teradata V2/SMP体系结构 40 2.2.4 Teradata V2/MPP体系结构 45 2.3 TERADATA 的 并 行 处 理 机 制 51 2.4 WINDOWS平台的TERADATA数据库 53 2.5 TERADATA多媒体数据库 54 第三章 TERADATA数据库的数据分配机制 57 3.1 哈希算法、主索引、与数据分配 57 3.2 TERADATA数据分配示例 59 3.3 主索引与表的创建 61 3.4 哈希冲突与不唯一主索引 62 3.5 TERADATA数据库系统的在线升级 64 第四章 TERADATA数据库的数据访问机制 66 4.1 基于主索引的数据访问 66 4.2 基于唯一次索引USI的数据访问 67 4.3 基于非唯一次索引NUSI的数据访问 70 4.4 全表扫描 74 4.5 总结 75 第五章 如何选择主索引 78 5.1 TERADATA数据库中的AMP与PDISK 78 5.2 数据记录的分配 79 5.3 选择主索引的基本原则 83 第六章 数据库的空间管理、用户管理、访问权限 84 6.1 TERADATA中的用户与数据库 84 6.1.1 数据库 84 6.1.2 用户 87 6.2 TERADATA数据库的层次型结构 87 6.3 拥有者(OWNER)与创建者(CREATOR) 91 6.4 TERADATA数据库的访问权限 93 6.4.1 访问权限概述 93 6.4.2 显示权限 101 6.4.3 监控权限 101 6.4.4 如何检查一个用户或数据库的权限 102 6.4.5 GRANT命令的操作 105 6.4.6 REVOKE命令的操作 106 第七章 数据保护与恢复 108 7.1 锁(LOCK) 108 7.2 优先权(PRIORITY) 112 7.3 交易完整性(TRANSACTION INTEGRITY) 113 7.4 临时流水(TRANSIENT JOURNAL) 114 7.5 永久流水(PERMANENT JOURNAL) 114 7.6 FALLBACK保护 115 第八章 客户端访问TERADATA数据库的方法 119 8.1 概述 119 8.2 TERADATA数据库的编程接口 121 8.2.1 调用层接口CLI 121 8.2.2 嵌入式预处理器 122 8.2.3 ODBC 122 8.3 TERADATA应用工具 123 8.3.1 BTEQ 123 8.3.2 FastLoad 124 8.3.3 MultiLoad 125 8.3.4 FastExport 126 8.3.5 TPump 126 第九章 使用TERADATA的主要客户分析 127 9.1 零售业 128 9.2 消费品制造与零售业供货商 129 9.3 货运业 130 9.4 客运业 131 9.5 电信业 132 9.6 健康保险业 133 9.7 金融业 135 9.8 共用事业类 137 9.9 其它行业 138 附录一 CLIENT/SERVER结构下的TERADATA数据库 151 附录二 TERADATA ODBC驱动程序设置 153 附录三 QUERYMAN介绍 156 附录四 WINDDI介绍 162