武汉大学商务智能考试复习指南:数据理解与属性分析

需积分: 50 13 下载量 45 浏览量 更新于2024-07-18 3 收藏 228KB DOCX 举报
商务智能复习题涵盖了武汉大学计算机学院的课程内容,旨在帮助学生准备期末考试。该资料主要围绕数据和商务智能的核心概念展开,包括但不限于: 1. 数据的理解:数据被定义为一系列事实的集合,来源于实验、观察、交易或经验,是商务智能分析的基础。 2. 数据集与数据对象:数据集由多个数据对象组成,每个对象代表一个实体,通过属性来描述其特征。 3. 数据分类:通过数据的对称轴(如在图形中的位置)来判断数据的性质,如b与a的符号关系,对称轴在y轴两侧可能带来不同的意义。 4. 非结构化数据与半结构化数据:前者如文本和多媒体,没有固定结构;后者如XML、JSON等虽有一定的结构,但在某些情况下也可视为非结构化数据。 5. 数据属性:属性是描述数据对象特性的基本单位,有不同的类型,如标称属性(类别性,如性别)、二元属性(只有两个状态,如真/假)、序数属性(有等级但无绝对大小,如满意度)、数值属性(可测量的数值)和区间标度属性(如温度)与比率标度属性(如重量)。 6. 属性的对称性:二元属性中的对称性意味着两个状态同等重要,非对称性则表明它们有不同的重要性。在处理非对称属性时,需识别并优先考虑重要属性。 7. 中心性测量:商务智能中常用的中心性度量包括均值(如通过池化函数计算)、中位数(适用于标称和次序属性)、众数(表示最常出现的值)以及中列数,用于反映数据分布的集中趋势。 8. 特别提到,对于标称属性,由于值之间的关系不是数量级的,只能使用众数作为中心性量度,而不能计算平均数或中值。同样,次序属性允许使用众数和中值,但不适用于平均数的计算。 这些知识点为商务智能的学习者提供了清晰的框架,有助于理解和应用数据处理、数据分析和决策支持技术。通过掌握这些概念,学生可以更好地理解和应对商务智能相关的考试题目。