数据仓库与数据挖掘项目建设关键技术与方法

版权申诉
0 下载量 3 浏览量 更新于2024-06-24 收藏 22.25MB PDF 举报
数据仓库与数据挖掘项目建设 数据仓库与数据挖掘项目建设是指通过对大量业务数据的收集、存储、分析和挖掘,获取有价值的信息,支持企业的管理决策。下面是数据仓库与数据挖掘项目建设的相关知识点: 1. 软件质量控制:软件质量控制是指为了获得更高的开发效率,避免返工,提高产品的市场竞争力,通过软件建模、度量、评审等活动来控制软件开发过程。 软件质量控制的主要目的是为了提高产品的质量和可靠性,提高客户对产品的满意度。软件质量控制包括软件建模、度量、评审等活动,以确保软件开发过程中的每个环节都能达到预期的目标。 2. 数据仓库知识简介:数据仓库是指面向主题的、集成的、稳定的同时又是随时间变化的大量数据集合。在综合使用一些应用软件下,用户获得想要的信息,最后为经营管理的决策提供有力的帮助。 数据仓库系统的业务特征是业务需求的范围与内容,不像业务系统那样清晰与明确。系统建设的主要风险是体现在软件工程质量与串接方面存在较大的过程风险。 3. 数据仓库的建设过程:数据仓库的建设过程需要控制风险、保证质量。质量控制是数据仓库建设的生命线,贯穿于数据仓库建设整个过程的始终。质量控制的中心环节包括事前控制、事中管理、事后控制等。 事前控制是指对方案与计划进行充分的咨询与论证;事中管理是指对建设开发阶段进行持续不断的过程控制;事后控制是指对于建设成果通过测试。 4. 数据挖掘:数据挖掘是指发现隐藏在各种数据之中的有用知识。数据挖掘需要对大量的业务数据进行统一与综合, 把业务数据转化为商业信息,支持决策。 数据挖掘的方法包括目标问题度量法、风险管理法、PDCA循环等。目标问题度量法是指通过软件质量目标并持续观察这些目标是否达到软件质量控制的一种方法;风险管理法是指识别与控制软件开发中对成功达到质量目标危害最大的哪些因素的系统性方法;PDCA循环是指计划、做、检查、与行动的循环过程。 5. 数据仓库的定义:数据仓库系统是一个面向主题的、集成的、稳定的同时又是随时间变化的大量数据集合。在综合使用一些应用软件下,用户获得想要的信息,最后为经营管理的决策提供有力的帮助。 数据仓库系统的业务特征是业务需求的范围与内容,不像业务系统那样清晰与明确。系统建设的主要风险是体现在软件工程质量与串接方面存在较大的过程风险。 6. 数据仓库的挑战:数据仓库的建设过程中存在着许多挑战,如如何来控制风险、如何来保证质量等。为了克服这些挑战,需要把质量控制作为数据仓库建设的生命线,贯穿于数据仓库建设整个过程的始终。