c4.5决策树python实现实例

以下是使用Python实现C4.5决策树的示例代码： ```python from math import log import operator def calcShannonEnt(dataSet): numEntries = len(dataSet) labelCounts = {} for featVec in dataSet: currentLabel = featVec[-1] if currentLabel not in labelCounts.keys(): labelCounts[currentLabel] = 0 labelCounts[currentLabel] += 1 shannonEnt = 0.0 for key in labelCounts: prob = float(labelCounts[key])/numEntries shannonEnt -= prob * log(prob, 2) return shannonEnt def createDataSet(): dataSet = [[1, 1, 'yes'], [1, 1, 'yes'], [1, 0, 'no'], [0, 1, 'no'], [0, 1, 'no']] labels = ['no surfacing','flippers'] return dataSet, labels def splitDataSet(dataSet, axis, value): retDataSet = [] for featVec in dataSet: if featVec[axis] == value: reducedFeatVec = featVec[:axis] reducedFeatVec.extend(featVec[axis+1:]) retDataSet.append(reducedFeatVec) return retDataSet def chooseBestFeatureToSplit(dataSet): numFeatures = len(dataSet[0]) - 1 baseEntropy = calcShannonEnt(dataSet) bestInfoGainRatio = 0.0 bestFeature = -1 for i in range(numFeatures): featList = [example[i] for example in dataSet] uniqueVals = set(featList) newEntropy = 0.0 splitInfo = 0.0 for value in uniqueVals: subDataSet = splitDataSet(dataSet, i, value) prob = len(subDataSet)/float(len(dataSet)) newEntropy += prob * calcShannonEnt(subDataSet) splitInfo -= prob * log(prob, 2) infoGain = baseEntropy - newEntropy if (splitInfo == 0): # fix the overflow bug continue infoGainRatio = infoGain / splitInfo if (infoGainRatio > bestInfoGainRatio): bestInfoGainRatio = infoGainRatio bestFeature = i return bestFeature def majorityCnt(classList): classCount = {} for vote in classList: if vote not in classCount.keys(): classCount[vote] = 0 classCount[vote] += 1 sortedClassCount = sorted(classCount.items(), key=operator.itemgetter(1), reverse=True) return sortedClassCount[0][0] def createTree(dataSet, labels): classList = [example[-1] for example in dataSet] if classList.count(classList[0]) == len(classList): return classList[0] if len(dataSet[0]) == 1: return majorityCnt(classList) bestFeat = chooseBestFeatureToSplit(dataSet) bestFeatLabel = labels[bestFeat] myTree = {bestFeatLabel:{}} del(labels[bestFeat]) featValues = [example[bestFeat] for example in dataSet] uniqueVals = set(featValues) for value in uniqueVals: subLabels = labels[:] myTree[bestFeatLabel][value] = createTree(splitDataSet(dataSet, bestFeat, value), subLabels) return myTree dataSet, labels = createDataSet() myTree = createTree(dataSet, labels) print(myTree) ```

c4.5决策树python实现实例

相关推荐

Python实现决策树C4.5算法的示例

python实现ID3决策树算法

Python机器学习之决策树算法实例详解

决策树C4.5--python实现伪代码

基于c4.5算法使用python实现算法实例

决策树连续型算法python实现

属性有性别成绩班委就业情况其中类标号属性为就业情况基于c4.5算法使用python实现算法实例50个训练样本并分别计算信息量再用10个测试样本进行测试给出完整代码

给一组数据类标号属性为属于鱼类属性有不浮出水面能生存和有脚蹼基于c4.5算法使用python实现算法实例50个训练数据并分别计算信息量再用10个测试数据进行测试给出完整代码

python实现C4.5算法的代码

利用python的C4.5算法写一个决策树的步骤及代码

python编程，实现C4.5算法和KNN算法

C4.5算法实现分类的原理和应用实例研究；

用Python实现一阶归纳学习FOIL算法

用C4.5算法实现实验数据分类完整代码

实现C4.5算法，验证算法的正确性，并将算法应用于C:/Users/Administrator/Desktop/Bank-data

基于Python的数据挖掘算法研究

基于Python实现的ID3决策树功能示例

决策树 python

最新推荐

Python机器学习之决策树算法实例详解

1719378276792.jpg

054ssm-jsp-mysql旅游景点线路网站.zip（可运行源码+数据库文件+文档）

基于单片机的篮球赛计时计分器.doc

基于springboot开发华强北商城二手手机管理系统vue+mysql+论文（毕业设计）.zip

GO婚礼设计创业计划：技术驱动的婚庆服务

管理建模和仿真的文件

【基础】PostgreSQL的安装和配置步骤

字节跳动面试题java

微信行业发展现状及未来发展趋势分析