数据挖掘九大定律:揭开商业价值的秘密

0 下载量 113 浏览量 更新于2024-08-30 收藏 161KB PDF 举报
数据挖掘之九大定律 数据挖掘是一种从数据中发现和解释知识的过程,这种知识是以自然或者人工形式创造的新知识。当前的数据挖掘形式,是在20世纪90年代实践领域诞生的,是在集成数据挖掘算法平台发展的支撑下适合商业分析的一种形式。也许是因为数据挖掘源于实践而非理论,在其过程的理解上不太引人注意。 数据挖掘之九大定律是指在数据挖掘过程中需要遵循的九种准则或“定律”。这些定律可以帮助数据挖掘实践者更好地理解数据挖掘过程,并且更好地指导数据挖掘的实施。 第一,目标律:业务目标是所有数据解决方案的源头。它定义了数据挖掘的主题:数据挖掘关注解决业务问题和实现业务目标。数据挖掘主要不是一种技术,而是一个过程,业务目标是它的核心。没有业务目标,没有数据挖掘(不管这种表述是否清楚)。因此这个准则也可以说成:数据挖掘是业务过程。 第二,知识律:业务知识是数据挖掘过程每一步的核心。这里定义了数据挖掘过程的一个关键特征。CRISP-DM的一种朴素的解读是业务知识仅仅作用于数据挖掘过程开始的目标的定义与最后的结果的实施,这将错过数据挖掘过程的一个关键属性,即业务知识是每一步的核心。 第三,准备律:数据预处理是数据挖掘过程的关键步骤。在这个步骤中,业务知识被用于塑造数据,使得业务问题可以被提出和解答。数据预处理的目的是将原始数据转换为适合数据挖掘的格式,并且删除无关的数据,以提高数据挖掘的效率和准确性。 第四,模型律:建模是使用数据挖掘算法创建预测模型,同时解释模型和业务目标的特点,也就是说理解它们之间的业务相关性。模型的准确性取决于业务知识和数据质量的充分性。 第五,评估律:评估是模型对理解业务的影响。评估的目的是评估模型的性能,并且确定模型是否能够满足业务目标的需求。 第六,实施律:实施是将数据挖掘结果作用于业务过程。实施的目的是将数据挖掘结果转换为实际的业务价值,并且提高业务的效率和质量。 第七,团队律:数据挖掘是一种团队协作的过程。数据挖掘需要多个团队成员的合作,包括业务专家、数据分析师、IT专家等。 第八,信息律:数据挖掘需要获取和存储大量的数据信息。数据信息的获取和存储是数据挖掘过程的关键步骤。 第九,技术律:数据挖掘需要使用多种技术和工具,包括机器学习、数据挖掘算法、数据存储等。 这九大定律可以帮助数据挖掘实践者更好地理解数据挖掘过程,并且更好地指导数据挖掘的实施。