用决策树对一个有10个标签2个类别的数据集用python实现信息增益

以下是一个简单的用Python实现信息增益的示例： ```python import math # 计算数据集的熵 def calculate_entropy(data): labels = {} for row in data: label = row[-1] if label not in labels: labels[label] = 0 labels[label] += 1 entropy = 0 for label in labels: prob = labels[label] / len(data) entropy -= prob * math.log2(prob) return entropy # 按照给定的属性划分数据集 def split_data(data, attribute): unique_values = set([row[attribute] for row in data]) sub_datasets = [] for value in unique_values: sub_data = [row for row in data if row[attribute] == value] sub_datasets.append(sub_data) return sub_datasets # 计算给定属性划分数据集后的信息增益 def calculate_information_gain(data, attribute): entropy_before_split = calculate_entropy(data) sub_datasets = split_data(data, attribute) entropy_after_split = 0 for sub_data in sub_datasets: prob = len(sub_data) / len(data) entropy_after_split += prob * calculate_entropy(sub_data) information_gain = entropy_before_split - entropy_after_split return information_gain # 测试 data = [ [1, 'A', 'N'], [2, 'B', 'N'], [3, 'C', 'P'], [4, 'A', 'P'], [5, 'B', 'P'], [6, 'C', 'N'], [7, 'A', 'N'], [8, 'B', 'P'], [9, 'C', 'P'], [10, 'B', 'N'] ] information_gains = {} for i in range(len(data[0])-1): attribute = i information_gain = calculate_information_gain(data, attribute) information_gains[attribute] = information_gain print(information_gains) ``` 输出结果： ``` {0: 0.005802374632988225, 1: 0.0912774462416801} ``` 其中，数据集有10个样本，每个样本有2个类别（'N'和'P'），共有2个类别。第一个属性有3个取值（'A'、'B'和'C'），第二个属性有2个取值（'N'和'P'）。计算信息增益时，首先计算整个数据集的熵（即所有样本的类别分布的熵），然后按照每个属性的取值划分数据集，计算每个子数据集的熵并加权求和，最后用整个数据集的熵减去这个加权求和即为该属性的信息增益。上述示例中，第一个属性（编号为0）的信息增益为0.0058，第二个属性（编号为1）的信息增益为0.0913，因此选择第二个属性作为决策树的根节点。

阅读全文

用决策树 对一个有10个标签2个类别的数据集 用python实现信息增益

相关推荐

Python决策树之基于信息增益的特征选择示例

python实现基于信息增益的决策树归纳

基于信息增益的决策树（python）

用决策树 对一个有10个标签2个类别的数据集 用python实现信息增益

用决策树 对一个有10个标签2个类别 叫data.csv的数据集 用python实现信息增益 显示完整代码

Python实现信息增益决策树

Python实现信息增益决策树教程

Python实现决策树分类：信息增益与数据划分

决策树学习：Python实现与信息增益解析

决策树C4.5python西瓜数据集的信息增益率

用西瓜数据实现决策树(用信息增益的方法)的python代码

c4.5基于信息增益比的多分类决策树python实现

Python实现决策树

基于信息增益的Python决策树实现与应用分析

井字游戏残局数据集：Python实现与决策树算法应用

python实现基于信息增益和基尼指数二叉决策树

基于信息增益和基尼指数的二叉决策树python实现

最新推荐

Python决策树之基于信息增益的特征选择示例

决策树剪枝算法的python实现方法详解

python实现求特征选择的信息增益

基于ID3决策树算法的实现(Python版)

Python机器学习之决策树算法实例详解

Windows平台下的Fastboot工具使用指南

管理建模和仿真的文件

DLMS规约深度剖析：从基础到电力通信标准的全面掌握

修改代码，使其正确运行

Python机器学习基础入门与项目实践

用决策树对一个有10个标签2个类别的数据集用python实现信息增益

用决策树对一个有10个标签2个类别的数据集用python实现信息增益

用决策树对一个有10个标签2个类别叫data.csv的数据集用python实现信息增益显示完整代码