没有合适的资源?快使用搜索试试~ 我知道了~
首页大学毕业论文---基于元数据的数据仓库性能优化系统.doc
大学毕业论文---基于元数据的数据仓库性能优化系统.doc
5星 · 超过95%的资源 需积分: 0 14 下载量 36 浏览量
更新于2023-03-03
评论
收藏 463KB DOC 举报
在数据仓库中,为了提高性能,使用的一项技术是创建汇总,汇总使特定类型的聚集视图, 通过在执行和存储数据到表以前,预先计算大的连接和聚集,提高查询性能的视图。在数据仓库中,可以使用实体化视图预先计算聚集数据,并把计算结果存储起来,实体化视图通常是通过查询重写机制进行访问的。查询重写用于基于成本的优化。-------------大学生毕业论文--------(数据挖掘)
资源详情
资源评论
资源推荐
福州大学 2004 届本科毕业论文
2004 届毕业生
毕业论文
题 目:基于元数据的数据仓库性能优化
院 系:__ 数学与计算机学院 _____
专 业:_ _ 计算机科学与技术
年 级:_____2000 ( 2 ) _________ ___
学 号:______1000228__________ ___
姓 名:______陈磊 ____________ ____
指导教师:_____________________ _____
第 1 页 共 29 页
福州大学 2004 届本科毕业论文
2004 年 6 月 10 日
摘要
随着数据仓库规模的扩大,数据仓库的性能问题就显得越来越突出,如何
提高数据仓库的性能,除了在设计阶段对其逻辑结构和物理结构进行优化设计
外;还可以在数据仓库运行阶段,采取一些优化措施来使系统性能最佳。
本系统主要功能是利用 oracle9i 所提供的技术:分区、实体化视图 和 查询
重写来实现数据仓库的性能优化:用户自己建表、视图并进行查询比较;比较
是否采用优化技术和直接查询的时间,体现优化程度。
关键词:数据仓库、分区、实体化视图、查询重写
Abstract
With the enlargement of the scale of data warehouse, the performance question of
the data warehouse seems more and more outstanding , how to improve performance
of warehouse, except that carry on optimization design to its logic structure and
physics structure during the course of designing; Can also take some optimization
measures to make systematic function best at the warehouse operation stage of the
data .
Main function of this system is to exploit technology offered by oracle9i institute:
partition , materialized view and query rewrite to realize optimization of data
warehouse: Users build tables , views and compare the request results; Compare
the time of adopting the technology of optimizing and the time of inquiring directly,
reflect the degree of optimizing.
第 2 页 共 29 页
福州大学 2004 届本科毕业论文
Keyword: Data warehouse, partition , materialized view ,query rewrite
目录
第一章 引言..............................................................................4
§1.1 课题背景.........................................................................................................4
§1.2 研究课题的任务、目的、意义.....................................................................5
1.2.1 课题的任务................................................................................................................5
1.2.2 课题的目的................................................................................................................5
1.2.3 课题的意义................................................................................................................5
§1.3 系统的主要功能与特色.................................................................................5
1.3.1 系统的主要功能大概如下........................................................................................5
1.3.2 系统的特色................................................................................................................6
第二章 系统的需求分析..........................................................6
§2.1 本课题研究现状分析.....................................................................................6
2.1.1 数据仓库性能优化的发展现状................................................................................6
2.1.2 数据仓库性能优化关键技术...................................................................................6
§2.2 要解决的技术难点......................................................................................10
§2.3 本系统设计的主要内容、目标...................................................................10
§2.4 系统开发的环境和工具...............................................................................10
第三章 系统的详细设计........................................................10
§3.1 系统的体系结构和功能设计.......................................................................10
3.1.1 系统的体系结构......................................................................................................10
3.1.2 系统所有的模块功能设计模块图........................................................................12
§3.2 系统各个模块的设计思路...........................................................................13
3.2.1 连接数据库并列表模块..........................................................................................13
3.2.2 用户建分区表模块.................................................................................................14
3.2.3 用户建实体化视图模块.........................................................................................16
第四章 系统实现和测试........................................................20
§4.1 系统主界面..................................................................................................20
§4.2 用户登录数据库的界面..............................................................................21
§4.3 建分区..........................................................................................................22
§4.4 建实体化视图..............................................................................................24
§4.5 查询后得到的结果集..................................................................................26
§4.6 比较时间的柱状图......................................................................................27
第 3 页 共 29 页
福州大学 2004 届本科毕业论文
第五章 结束语........................................................................28
致 谢.........................................................................................28
参 考 文 献...............................................................................29
第一章 引言
§1.1 课题背景
随着计算机技术的飞速发展和企业界不断提出新的需要,数据仓库技术
应运而生。当前的数据处理可以大致地划分为两大类:操作型处理和分析型处
理。操作型处理也叫事务处理,是指对数据库联机地日常操作,人们关心地是
响应时间、数据的安全性和完整性。分析型处理又叫信息型处理,用于管理人
员的决策分析。两者之间的巨大差异使得操作型处理和分析型处理的分离成为
必然。数据库系统作为数据管理手段,主要用于事务处理。而数据仓库有助于
把数据转变成信息,为用户提供决策支持。但是必须注意的是:即使可以建立
一个数据仓库来帮助制定决策,仍然有可能在具有完美数据的情况下作出坏的
决策。
随着数据仓库规模的扩大,数据仓库的性能问题就显得越来越突出,如何
提高数据仓库的性能进行优化,除了在设计阶段对其逻辑结构和物理结构进行
优化设计,使之在满足需求条件的情况下,系统性能达到最佳,系统开销达到
最小外;还可以在数据仓库运行阶段,采取一些优化措施来使系统性能最佳。
在 Oracle9i 中,使用关系数据库存储数据仓库中的数据,数据仓库中包含
大量的数据,对数据的提取和更新操作需要花费大量的时间和资源,为了能够
管理好这些大表,同时提高访问大表的查询速度和执行效率,就需要用到并行
处理和分区。
在数据仓库中,为了提高性能,使用的一项技术是创建汇总,汇总使特定
类型的聚集视图, 通过在执行和存储数据到表以前,预先计算大的连接和聚集,
提高查询性能的视图。在数据仓库中,可以使用实体化视图预先计算聚集数据,
第 4 页 共 29 页
福州大学 2004 届本科毕业论文
并把计算结果存储起来,实体化视图通常是通过查询重写机制进行访问的。查
询重写用于基于成本的优化。
§1.2 研究课题的任务、目的、意义
1.2.1 课题的任务
(1) 研究提高数据仓库性能的机制;
(2) 实现分区处理;
(3) 实现实体化视图,查询重写;
(4) 将步骤 2 和步骤 3 中未分区、未采用实体化视图、未查询重写进行比
较给出实验数据结果。
1.2.2 课题的目的
通过完 成本课题,熟悉 Oracle 数据 仓库的应用和 开发,学 会如 何用
Oracle
所提供的工具和技术对数据仓库进行优化处理。
1.2.3 课题的意义
随着企业规模的扩大,企业的数据仓库的数据量往往非常大,包含了大量
的历史数据。要在大量的数据中查询,进行决策分析,数据仓库的性能问题就
显得越来越突出,也是用户最能感受的。Oralce 实现了优化查询的机制,使得
我们对数据仓库的大型查询能够得到快速响应。
§1.3 系统的主要功能与特色
1.3.1 系统的主要功能大概如下
◆用户与 oracle 数据库的接口,系统验证用户信息,若用户输入的用户名和密
码等信息无误,则提示连接数据库成功,否则,捕捉异常,提示失败原因。
◆提供用户建分区表或实体化视图功能:用户提供分区表或实体化视图的相关
信息,系统检测信息是否合法,如果合法,则提示创建成功,并将信息存入到
oracle 数据库中,否则,捕捉异常,提示失败原因。
◆提供用户对 oracle 数据库中的表进行查询的功能:用户选择表,并输入查询
条件,系统验证此 sql 语句是否合法,若合法,则执行查询,并将结果显示出
第 5 页 共 29 页
剩余28页未读,继续阅读
jacky2009li
- 粉丝: 0
- 资源: 5
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- 27页智慧街道信息化建设综合解决方案.pptx
- 计算机二级Ms-Office选择题汇总.doc
- 单链表的插入和删除实验报告 (2).docx
- 单链表的插入和删除实验报告.pdf
- 物联网智能终端项目设备管理方案.pdf
- 如何打造品牌的模式.doc
- 样式控制与页面布局.pdf
- 武汉理工Java实验报告(二).docx
- 2021线上新品消费趋势报告.pdf
- 第3章 Matlab中的矩阵及其运算.docx
- 基于Web的人力资源管理系统的必要性和可行性.doc
- 基于一阶倒立摆的matlab仿真实验.doc
- 速运公司物流管理模式研究教材
- 大数据与管理.pptx
- 单片机课程设计之步进电机.doc
- 大数据与数据挖掘.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论1