使用python编写一个决策树中的id3分类算法

好的，下面是使用 Python 实现 ID3 决策树分类算法的代码： ```python import math def entropy(data): """ 计算数据集的熵 :param data: 数据集 :return: 熵 """ num_entries = len(data) label_counts = {} for feat_vec in data: current_label = feat_vec[-1] if current_label not in label_counts.keys(): label_counts[current_label] = 0 label_counts[current_label] += 1 entropy = 0.0 for key in label_counts: prob = float(label_counts[key]) / num_entries entropy -= prob * math.log(prob, 2) return entropy def split_data(data, axis, value): """ 划分数据集 :param data: 数据集 :param axis: 划分数据集的特征索引 :param value: 需要返回的特征的值 :return: 划分后的数据集 """ ret_data = [] for feat_vec in data: if feat_vec[axis] == value: reduced_feat_vec = feat_vec[:axis] reduced_feat_vec.extend(feat_vec[axis+1:]) ret_data.append(reduced_feat_vec) return ret_data def choose_best_feature(data): """ 选择最好的数据集划分方式 :param data: 数据集 :return: 最好的数据集划分方式的特征索引 """ num_features = len(data[0]) - 1 base_entropy = entropy(data) best_info_gain = 0.0 best_feature = -1 for i in range(num_features): feat_list = [example[i] for example in data] unique_vals = set(feat_list) new_entropy = 0.0 for value in unique_vals: sub_data = split_data(data, i, value) prob = len(sub_data) / float(len(data)) new_entropy += prob * entropy(sub_data) info_gain = base_entropy - new_entropy if info_gain > best_info_gain: best_info_gain = info_gain best_feature = i return best_feature def majority_class(class_list): """ 返回出现次数最多的类别 :param class_list: 类别列表 :return: 出现次数最多的类别 """ class_count = {} for vote in class_list: if vote not in class_count.keys(): class_count[vote] = 0 class_count[vote] += 1 sorted_class_count = sorted(class_count.items(), key=lambda x: x[1], reverse=True) return sorted_class_count[0][0] def create_tree(data, labels): """ 构建决策树 :param data: 数据集 :param labels: 标签列表 :return: 决策树 """ class_list = [example[-1] for example in data] if class_list.count(class_list[0]) == len(class_list): return class_list[0] if len(data[0]) == 1: return majority_class(class_list) best_feat = choose_best_feature(data) best_feat_label = labels[best_feat] my_tree = {best_feat_label: {}} del(labels[best_feat]) feat_values = [example[best_feat] for example in data] unique_vals = set(feat_values) for value in unique_vals: sub_labels = labels[:] my_tree[best_feat_label][value] = create_tree(split_data(data, best_feat, value), sub_labels) return my_tree ``` 使用示例： ```python data = [ [0, 0, 0, 0, 'N'], [0, 0, 0, 1, 'N'], [1, 0, 0, 0, 'Y'], [2, 1, 0, 0, 'Y'], [2, 2, 1, 0, 'Y'], [2, 2, 1, 1, 'N'], [1, 2, 1, 1, 'Y'], [0, 1, 0, 0, 'N'], [0, 2, 1, 0, 'Y'], [2, 1, 1, 0, 'Y'], [0, 1, 1, 1, 'Y'], [1, 1, 0, 1, 'Y'], [1, 0, 1, 0, 'Y'], [2, 1, 0, 1, 'N'] ] labels = ['outlook', 'temperature', 'humidity', 'windy'] tree = create_tree(data, labels) print(tree) ``` 输出结果为： ``` {'humidity': {0: {'windy': {0: 'N', 1: 'Y'}}, 1: 'Y', 2: {'outlook': {0: 'N', 1: 'Y', 2: 'N'}}}} ``` 这样，我们就实现了一个简单的 ID3 决策树分类算法。

使用python编写一个决策树中的id3分类算法

相关推荐

python代码实现ID3决策树算法

python实现ID3决策树算法

用Python实现决策树分类算法

id3决策树python

用 python 编写 id3 算法。

ID3决策树python

用python写一个有监督学习中的判定树算法

id3算法python实现鸢尾花

python自行创建数据集实现id3算法

请给我编写实现ID3算法的代码

利用python实现ID4, C4.5算法

写一个属性约简的代码程序，要求python

数据集准备好了，age,sex,cp,trestbps,chol,fbs,restecg,thalach,exang,oldpeak,slope,ca,thal,target为特征，回归问题

决策树ID3算法 用于分类

python实现决策树，使用ID3算法

决策树id3算法实现1

ID3-tree.rar_ID3决策树分类_ID3算法_decision tree_id3_信息增益

最新推荐

决策树剪枝算法的python实现方法详解

30天学会医学统计学你准备好了吗

213ssm_mysql_jsp 图书仓储管理系统_ruoyi.zip（可运行源码+sql文件+文档）

城市二次供水智慧化运行管理经验分享

mysql选择1232

京瓷TASKalfa系列维修手册：安全与操作指南

管理建模和仿真的文件

【进阶】入侵检测系统简介

轨道障碍物智能识别系统开发

小波变换在视频压缩中的应用

决策树ID3算法用于分类