数据挖掘十大经典算法——C4.5
时间: 2023-09-18 14:15:20 浏览: 127
大数据十大经典算法c4.5讲解.ppt
C4.5算法是决策树学习算法中的一种,是Ross Quinlan于1993年提出的,是ID3算法的改进版。C4.5算法与ID3算法的不同在于,C4.5算法使用信息增益比来选择最佳分类属性,避免了ID3算法中可能存在的偏向选择取值较多的属性的问题。C4.5算法还可以处理连续属性和缺失值,具有很好的灵活性。
C4.5算法的流程如下:
1. 构造决策树根节点。
2. 选择最佳分类属性,计算信息增益比。
3. 根据该属性的取值将数据集划分为若干子集,对每个子集递归构建子树。
4. 重复2-3步骤,直到所有属性都被使用或者划分后的样本集合都属于同一类别。
C4.5算法是一种经典的数据挖掘算法,在实际应用中得到了广泛的使用。
阅读全文