用c++写一个判断西瓜好坏的决策树代码，并附上注释和训练数据

好的，下面是C++代码实现： ```c++ #include <iostream> using namespace std; // 定义西瓜的属性结构体 struct Watermelon { int color; // 颜色，0代表青绿，1代表乌黑，2代表浅白 float root; // 根蒂，0代表蜷缩，1代表稍蜷，2代表硬挺 float sound; // 敲声，0代表沉闷，1代表浊响，2代表清脆 int good; // 是否好瓜，0代表否，1代表是 }; // 定义训练数据 Watermelon train_data[] = { {0, 0, 0, 0}, {0, 0, 1, 0}, {1, 0, 1, 1}, {2, 0, 1, 1}, {2, 1, 0, 1}, {2, 2, 1, 0}, {1, 1, 0, 1}, {0, 2, 1, 0}, {0, 1, 0, 1}, {2, 1, 1, 1}, {0, 1, 1, 1}, {1, 0, 0, 0}, {1, 1, 1, 1}, {2, 1, 0, 0} }; // 计算数据集中好瓜和坏瓜的个数 void count_good_bad(Watermelon *data, int len, int &good, int &bad) { good = 0; bad = 0; for (int i = 0; i < len; i++) { if (data[i].good == 1) { good++; } else { bad++; } } } // 计算数据集中给定属性的某个值的好瓜和坏瓜的个数 void count_good_bad_by_attr(Watermelon *data, int len, int attr, float value, int &good, int &bad) { good = 0; bad = 0; for (int i = 0; i < len; i++) { if (data[i].good == 1 && data[i].color == value) { good++; } else if (data[i].good == 0 && data[i].color == value) { bad++; } } } // 计算数据集中给定两个属性的某个值的好瓜和坏瓜的个数 void count_good_bad_by_attr(Watermelon *data, int len, int attr1, float value1, int attr2, float value2, int &good, int &bad) { good = 0; bad = 0; for (int i = 0; i < len; i++) { if (data[i].good == 1 && data[i].color == value1 && data[i].root == value2) { good++; } else if (data[i].good == 0 && data[i].color == value1 && data[i].root == value2) { bad++; } } } // 计算数据集中给定三个属性的某个值的好瓜和坏瓜的个数 void count_good_bad_by_attr(Watermelon *data, int len, int attr1, float value1, int attr2, float value2, int attr3, float value3, int &good, int &bad) { good = 0; bad = 0; for (int i = 0; i < len; i++) { if (data[i].good == 1 && data[i].color == value1 && data[i].root == value2 && data[i].sound == value3) { good++; } else if (data[i].good == 0 && data[i].color == value1 && data[i].root == value2 && data[i].sound == value3) { bad++; } } } // 训练决策树 void train_decision_tree(Watermelon *data, int len, int depth) { int good, bad; count_good_bad(data, len, good, bad); if (good == 0 || bad == 0) { if (good == 0) { cout << "这是个坏瓜" << endl; } else { cout << "这是个好瓜" << endl; } return; } if (depth == 0) { if (good > bad) { cout << "这是个好瓜" << endl; } else { cout << "这是个坏瓜" << endl; } return; } // 选择最优属性 float info_gain, max_info_gain = -1; int best_attr = -1; for (int i = 0; i < 3; i++) { int num_values; float values[3]; if (i == 0) { num_values = 3; values[0] = 0; values[1] = 1; values[2] = 2; } else { num_values = 2; values[0] = 0; values[1] = 1; } for (int j = 0; j < num_values; j++) { int temp_good, temp_bad; if (i == 0) { count_good_bad_by_attr(data, len, i, values[j], temp_good, temp_bad); } else if (i == 1) { count_good_bad_by_attr(data, len, i, values[j], 2, 0, temp_good, temp_bad); } else { count_good_bad_by_attr(data, len, i, values[j], 0, 0, 1, 1, temp_good, temp_bad); } float p_good = (float)temp_good / (float)(temp_good + temp_bad); float p_bad = (float)temp_bad / (float)(temp_good + temp_bad); float temp_info_gain = -p_good * log2(p_good) - p_bad * log2(p_bad); if (temp_info_gain > max_info_gain) { max_info_gain = temp_info_gain; best_attr = i; } } } // 根据最优属性划分子数据集并递归训练 if (best_attr == 0) { int num_values = 3; float values[3]; values[0] = 0; values[1] = 1; values[2] = 2; for (int j = 0; j < num_values; j++) { int temp_good, temp_bad; count_good_bad_by_attr(data, len, best_attr, values[j], temp_good, temp_bad); cout << "如果颜色是" << values[j] << "："; if (temp_good == 0 || temp_bad == 0) { if (temp_good == 0) { cout << "这是个坏瓜" << endl; } else { cout << "这是个好瓜" << endl; } } else { Watermelon *sub_data = new Watermelon[temp_good + temp_bad]; int index = 0; for (int k = 0; k < len; k++) { if (data[k].color == values[j]) { sub_data[index++] = data[k]; } } train_decision_tree(sub_data, index, depth - 1); } } } else if (best_attr == 1) { int num_values = 2; float values[2]; values[0] = 0; values[1] = 1; for (int j = 0; j < num_values; j++) { int temp_good, temp_bad; count_good_bad_by_attr(data, len, best_attr, values[j], 2, 0, temp_good, temp_bad); cout << "如果根蒂是" << values[j] << "："; if (temp_good == 0 || temp_bad == 0) { if (temp_good == 0) { cout << "这是个坏瓜" << endl; } else { cout << "这是个好瓜" << endl; } } else { Watermelon *sub_data = new Watermelon[temp_good + temp_bad]; int index = 0; for (int k = 0; k < len; k++) { if (data[k].root == values[j]) { sub_data[index++] = data[k]; } } train_decision_tree(sub_data, index, depth - 1); } } } else { int num_values = 2; float values[2]; values[0] = 0; values[1] = 1; for (int j = 0; j < num_values; j++) { int temp_good, temp_bad; count_good_bad_by_attr(data, len, best_attr, values[j], 0, 0, 1, 1, temp_good, temp_bad); cout << "如果敲声是" << values[j] << "："; if (temp_good == 0 || temp_bad == 0) { if (temp_good == 0) { cout << "这是个坏瓜" << endl; } else { cout << "这是个好瓜" << endl; } } else { Watermelon *sub_data = new Watermelon[temp_good + temp_bad]; int index = 0; for (int k = 0; k < len; k++) { if (data[k].sound == values[j]) { sub_data[index++] = data[k]; } } train_decision_tree(sub_data, index, depth - 1); } } } } int main() { train_decision_tree(train_data, 14, 3); return 0; } ``` 训练数据如下： ``` 颜色根蒂敲声是否好瓜 0 0 0 0 0 0 1 0 1 0 1 1 2 0 1 1 2 1 0 1 2 2 1 0 1 1 0 1 0 2 1 0 0 1 0 1 2 1 1 1 0 1 1 1 1 0 0 0 1 1 1 1 2 1 0 0 ``` 其中，颜色属性的值为0代表青绿，1代表乌黑，2代表浅白；根蒂属性的值为0代表蜷缩，1代表稍蜷，2代表硬挺；敲声属性的值为0代表沉闷，1代表浊响，2代表清脆；是否好瓜属性的值为0代表否，1代表是。

阅读全文

用c++写一个判断西瓜好坏的决策树代码，并附上注释和训练数据

相关推荐

c++实现决策树分类算法(内附测试数据)

决策树-C++代码

面向对象程序设计课程设计：利用决策树判断西瓜质量（源代码）

决策树C++代码示例

数据挖掘与数据分析应用案例 数据挖掘算法实践 基于C++的决策树算法的西瓜分类辨别.doc

数据挖掘 决策树代码

DecisionTree.rar_c++决策树_cpp决策树_决策树_决策树 C

C++实现决策树 含数据集

通用的C++数据结构代码实现，使用模板 代码完整，注释齐全，可直接运行，可使用doxygen生成网页和PDF文档

决策树算法C++实现

c_c4.5.zip_C4.5 C++_c4.5_c语言决策树_决策树c4.5_决策树c语言

通用的C++数据结构代码实现，使用模板 代码完整，注释齐全，可直接运行，可使用doxygen生成网页和PDF文档，跨Window

机器学习C++源码解析-决策树cart算法-源码+数据

C++实现一个简易的魔塔，内含源代码和可执行文件，和注释

数据挖掘与数据分析应用案例 数据挖掘算法实践 基于C++的决策树分类算法研究.doc

数据挖掘与数据分析应用案例 数据挖掘算法实践 基于C++的决策树分类算法报告.doc

数据挖掘与数据分析应用案例 数据挖掘算法实践 基于C++的决策树分类算法实现.doc

决策树算法的C++实现

C++实现决策树CART算法源码及数据解析

决策树算法实现：西瓜质量评判系统源代码解析

大家在看

Video-Streamer:RTSP视频客户端和服务器

短消息数据包协议

国自然标书医学下载国家自然科学基金面上课题申报中范文模板2023

论文研究-一种面向HDFS中海量小文件的存取优化方法.pdf

批量标准矢量shp互转txt工具

最新推荐

C++如何判断一个数字是否为质数

C/C++读写注册表中二进制数据(代码示例)

C++实现两个有序数组的合并

C++使用Kruskal和Prim算法实现最小生成树

C++语言数据结构 串的基本操作实例代码

HTML挑战：30天技术学习之旅

【CodeBlocks精通指南】：一步到位安装wxWidgets库（新手必备）

andorid studio 配置ERROR: Cause: unable to find valid certification path to requested target

VC++实现文件顺序读写操作的技巧与实践

【大数据时代必备：Hadoop框架深度解析】：掌握核心组件，开启数据科学之旅

数据挖掘与数据分析应用案例数据挖掘算法实践基于C++的决策树算法的西瓜分类辨别.doc

数据挖掘决策树代码

C++实现决策树含数据集

通用的C++数据结构代码实现，使用模板代码完整，注释齐全，可直接运行，可使用doxygen生成网页和PDF文档

通用的C++数据结构代码实现，使用模板代码完整，注释齐全，可直接运行，可使用doxygen生成网页和PDF文档，跨Window

数据挖掘与数据分析应用案例数据挖掘算法实践基于C++的决策树分类算法研究.doc

数据挖掘与数据分析应用案例数据挖掘算法实践基于C++的决策树分类算法报告.doc

数据挖掘与数据分析应用案例数据挖掘算法实践基于C++的决策树分类算法实现.doc

C++语言数据结构串的基本操作实例代码