python实现西瓜2.0决策树

以下是一个简单的Python实现示例： ```python import pandas as pd import numpy as np # 定义数据集 data = { '色泽': ['青绿', '乌黑', '乌黑', '青绿', '浅白', '青绿', '乌黑', '乌黑', '乌黑', '青绿'], '根蒂': ['蜷缩', '蜷缩', '硬挺', '蜷缩', '蜷缩', '稍蜷', '稍蜷', '蜷缩', '稍蜷', '硬挺'], '敲声': ['浊响', '沉闷', '浊响', '沉闷', '浊响', '浊响', '沉闷', '浊响', '浊响', '沉闷'], '纹理': ['清晰', '稍糊', '清晰', '稍糊', '清晰', '?', '?', '稍糊', '?', '稍糊'], '脐部': ['凹陷', '凹陷', '凹陷', '凹陷', '凹陷', '稍凹', '稍凹', '凹陷', '稍凹', '硬挺'], '触感': ['硬滑', '硬滑', '硬滑', '硬滑', '硬滑', '软粘', '软粘', '硬滑', '软粘', '软粘'], '好瓜': ['是', '是', '是', '是', '是', '是', '是', '是', '否', '否'] } df = pd.DataFrame(data) # 定义信息熵函数 def entropy(s): _, counts = np.unique(s, return_counts=True) p = counts / len(s) return -np.sum(p * np.log2(p)) # 定义信息增益函数 def gain(data, feature, target): target_entropy = entropy(data[target]) feature_values, counts = np.unique(data[feature], return_counts=True) weighted_feature_entropy = np.sum([(counts[i] / np.sum(counts)) * entropy(data.where(data[feature]==feature_values[i]).dropna()[target]) for i in range(len(feature_values))]) return target_entropy - weighted_feature_entropy # 定义决策树构建函数 def build_tree(data, features, target): # 如果数据集中所有瓜都是同一种，则返回叶节点，将该瓜类别作为节点值 if len(np.unique(data[target])) <= 1: return np.unique(data[target])[0] # 如果没有特征可供选择，则返回叶节点，将数据集中出现次数最多的瓜类别作为节点值 if len(features) == 0: return data[target].mode()[0] # 否则，选择信息增益最大的特征进行分割 best_feature = max(features, key=lambda f: gain(data, f, target)) # 创建新的决策树节点，并递归处理子树 tree = {best_feature: {}} for value in np.unique(data[best_feature]): sub_data = data.where(data[best_feature] == value).dropna() sub_tree = build_tree(sub_data, [f for f in features if f != best_feature], target) tree[best_feature][value] = sub_tree return tree # 构建决策树 tree = build_tree(df, df.columns[:-1], '好瓜') # 打印决策树 import json print(json.dumps(tree, indent=4)) ``` 希望这个示例能对你有所帮助！

阅读全文

python实现西瓜2.0决策树

相关推荐

Python实现决策树

使用Python实现决策树

python实现决策树

Python利用ID3算法实现西瓜数据集决策树可视化教程

用决策树对西瓜数据集2.0分类，python代码

参照ID3算法，编写决策树算法的code,并实现在西瓜数据集2.0上的分类python代码

使用西瓜数据集2.0完成完整决策树代码

用西瓜数据2.0实现决策树 要求： 1.使用信息增益的方法 2.将数据集及代码放在同一目录中（使用相对引用的形式） 3.保存所生成的决策树图形（以png的形式，放在数据及代码同一目录中） 4.对代码进行注释

用西瓜数据2.0实现决策树 要求: 1.使用信息增益的方法 2.将数据集及代码放在同一目录中 (使用相对引|用的形式) 3.保存所生成的决策树图形(以png的形式,放在数据及代码同一目录 中) 4.对代码进行注释

python使用ID3、C4.5、CART实现西瓜数据集决策树并画出图像

【机器学习】python构建ID3决策树+pygraphviz可视化（代码详解，附注释）

决策树剪枝算法的python实现方法详解

西瓜书《机器学习》---第四章 决策树python代码实现

watermelon_决策树_西瓜数据集_西瓜数据_

机器学习-决策树（以西瓜数据集为例）

C4.5算法在西瓜集2.0数据集上的决策分类应用

用决策树对西瓜数据集2.0分类

参照ID3算法，编写决策树算法的code,并实现在西瓜数据集2.0上的分类spider代码

最新推荐

决策树剪枝算法的python实现方法详解

毕设和企业适用springboot企业数据管理平台类及跨境电商管理平台源码+论文+视频.zip

基于net的超市管理系统源代码（完整前后端+sqlserver+说明文档+LW）.zip

LABVIEW程序实例-公式节点.zip

毕设和企业适用springboot社交应用平台类及用户数据分析平台源码+论文+视频.zip

Windows平台下的Fastboot工具使用指南

管理建模和仿真的文件

DLMS规约深度剖析：从基础到电力通信标准的全面掌握

修改代码，使其正确运行

Python机器学习基础入门与项目实践

用西瓜数据2.0实现决策树要求： 1.使用信息增益的方法 2.将数据集及代码放在同一目录中（使用相对引用的形式） 3.保存所生成的决策树图形（以png的形式，放在数据及代码同一目录中） 4.对代码进行注释

用西瓜数据2.0实现决策树要求: 1.使用信息增益的方法 2.将数据集及代码放在同一目录中 (使用相对引|用的形式) 3.保存所生成的决策树图形(以png的形式,放在数据及代码同一目录中) 4.对代码进行注释

西瓜书《机器学习》---第四章决策树python代码实现