SQL Server关系型数据仓库分区策略详解与最佳实践

需积分: 10 197 浏览量更新于2024-07-23 收藏 996KB DOC 举报

在Microsoft SQL Server中，关系型数据仓库的分区策略是一个关键组成部分，用于优化数据管理和查询性能。本篇文章由Gandhi Swaminathan、Hao Chen、Rakesh Gujjula、Gang He等人合作撰写，并经过技术专家如Wey Guy、Stuart Ozer、Arun Marathe等人审阅，旨在为SQL Server 2005用户提供深入理解数据仓库分区的重要指导。分区策略在SQL Server中主要分为两种： 1. **策略 I：分区到独立文件组** - 这个策略将每个分区的数据存储在一个单独的文件组中，这样可以提高读取特定分区的速度，因为I/O操作可以在特定的物理位置上执行。这种方式适用于那些查询频繁集中在特定区域的数据，比如按时间范围（如月度或季度）进行的分析。 2. **策略 II：多个分区共享文件组** - 在这种情况下，两个或更多的分区共用一个文件组，可能出于空间效率或者减少文件系统碎片的考虑。然而，这可能导致查询性能下降，特别是当涉及跨分区操作时，因为I/O操作可能涉及到多个分区的文件。作者建议读者首先了解SQL Server 2000中的分区概念（例如，如何在数据仓库中使用分区）和批量导入方法，以及SQL Server 2005分区表和索引的特性。本文特别针对以下受众： - 开发人员和DBA，他们已经熟悉SQL Server分区视图，将从中获益于SQL Server 2005的新功能，包括滑动窗口实现和优化的分区策略。 - 对未来计划使用分区的开发人员和DBA，他们可以通过详细阅读此白皮书来规划和实施更有效的分区策略。此外，对于数据库和系统管理员，白皮书还涵盖了存储域网络管理和优化I/O利用策略，帮助他们更好地管理资源和性能。值得注意的是，由于白皮书是初步文档，内容可能会在SQL Server的最终商业发布时有所调整，提供的信息反映了文档出版时微软公司的观点。总结来说，本文详细探讨了如何在SQL Server中选择和实施关系型数据仓库的分区策略，以及如何根据不同的业务需求和性能目标进行决策，确保数据的高效管理和查询性能。对于所有与SQL Server数据仓库工作相关的专业人员来说，这是不可或缺的参考资料。

附录 C: 服务器体系结构15

附录 D: EMC CLARiiON 存储 15

拓朴444444444444444444444444444444444444444444444444444444444444444444444444444444444444444444444444444444444444444444444444444 ?F

附录 E: 存储隔离 17

配置你的存储444444444444444444444444444444444444444444444444444444444444444444444444444444444444444444444444444444444444444 ?C

附录 F: 脚本 18

在 /0+,- 中的关系型数据仓库分区策略 ?

对一个关系型数据仓库进行分区

以下的部份将会简要的解释关系型数据仓库的概念，为关系型数据仓库进行分区的好处，以及迁移

到 /0.+,-G"##$ 分区的好处。

关于关系型数据仓库

关系型数据仓库提供了一个广泛的数据来源以及一个用来构建业务智能（!&）解决方案的体系结构。

另外，关系型数据仓库可以为报表应用程序以及复杂且专用的 +, 查询所用。

一个典型的关系型数据仓库是由维度表以及事实表组成的。维度表通常会比事实表小一些并且其中

提供了关于解释事实的属性的详细信息。一个维度的例子是货物，商店和时间。事实表提供了对商

业记录的描述，比如在所有商店中货物销售的信息。事实表通过最近收集到的数据进行不断的更新。

一个成功的关系型数据仓库解决方案的实现包括细致而长期的规划。以下列出了在构建一个关系型

数据仓库时要考虑的要素：

 数据量

 数据导入窗口

 索引维护窗口

 工作负载特征

 数据老化策略

 存档和备份策略

 硬件特征

这个文档后面的部份将会有对以上要素的详细讨论。

一个关系型数据仓库在实现时可以采用分区的方法或者一个（巨大）事实表的方法。对于使用分区

还是不分区方式的设计选择主要依赖于前面列出的各个要素。关系型数据仓库可以从数据分区中获

益。以下部份着重谈到了分区为关系型数据仓库带来的好处。

分区的好处

当组织中的数据库向上扩展并且包含了大量的数据时，非常关键的是保持其高可用性并同时适应对

小的数据库维护窗口的需要。这些需求使得分区成为对于超大型数据库而言的一个量身定制的技术。

分区技术所强调的关键问题是——通过将非常大的表分解成相对较小的分区从而使诸如数据导入，

老化以及存档等重要任务的管理更易于进行。/0+,- 通过在 +,-

@4#3"### 中的分区视图以及在 +,-"##$ 中添加的对分区表的支持提供了分区技术。

在 +,-@4#3"### 中的分区技术

+,-@4# 通过分区视图引入了对分区技术的支持。在 +,-"### 中，这一功能进

行了增强支持了可更新的分区视图。当事实表可以被自然的分割或者根据数据范围划分成单独的表

时，对于关系型数据仓库而言分区视图技术是再合适不过的了。分区视图的基表可以被 7H&H 来

表示成一个统一的数据集。分区视图大大降低成本应用程序的复杂性，原因是物理实现被从应用程

序数据访问方式中抽象了出来。

在 +,-"### 中，分区视图可以被扩展到包括分布式分区视图，从而启用跨多个服务器3实

例的数据库联合。有关分布式分区视图的讨论超出了本文的范围。对此更详细的讨论，请参阅微软

开发人员网络（'H）上的“分布式分区视图”，地址是

2(334/04/3:3-303242 I0J2(33 

4/04/3:3-3032424

剩余25页未读，继续阅读

nana916

粉丝: 0
资源: 8

SQL Server关系型数据仓库分区策略详解与最佳实践

大型数据仓库最佳实践

使用Oracle移植工作台从MicrosoftSQLServer移植到Oracle数据.doc

MicrosoftSQLServer数据库的数据维护

microsoftsqlserver怎么使用

MicrosoftSQLserver建表

microsoftsqlserver安装失败

执行 Transact-SQL语句或批处理时发生了异常。(MicrosoftSqlServer.ConnectionInfo) 无法用排他锁锁定该数据库，以执行该操作。

sql 2019 for windows 下载地址

《MicrosoftSQLSERVER2000关系数据库》教学大纲文.pdf

使用Oracle移植工作台从MicrosoftSQLServer移植到Oracle数据.docx

最新资源