根据下列给定的14个数据,运用Information Gain构造一个天气决策树。 例子编号 属 性 分类 天况 温度 湿度 风况 1 晴 热 大 无 N 2 晴 热 大 有 N 3 多云 热 大 无 P 4 雨 中 大 无 P 5 雨 冷 正常 无 P 6 雨 冷 正常 有 N 7 多云 冷 正常 有 P 8 晴 中 大 无 N 9 晴 冷 正常 无 P 10 雨 中 正常 无 P 11 晴 中 正常 有 P 12 多云 中 大 有 P 13 多云 热 正常 无 P 14 雨 中 大 有 N
时间: 2024-04-01 21:32:27 浏览: 95
数据挖掘算法
好的,根据给定的14个数据,我们可以按照Information Gain的原则来构造一个天气决策树。
首先,我们需要计算每个属性的信息增益,以选择最佳属性作为根节点。根据公式 I(D,P) = H(D) - H(D|P),我们可以得到以下结果:
- 天气:0.246
- 温度:0.029
- 湿度:0.152
- 风力:0.048
因此,我们可以选择天气作为根节点,它有三个分支:晴天、多云和雨天。接下来,我们可以按照同样的方式计算每个分支的信息增益,以选择最佳属性作为子节点。
以晴天为例,我们可以选择温度作为子节点。温度又可以分为热、中和冷三个分支。根据计算得到的信息增益,我们选择温度作为子节点。
以热为例,我们可以选择湿度作为子节点。湿度又可以分为大和正常两个分支。根据计算得到的信息增益,我们选择湿度作为子节点。
以大为例,我们可以将结果设置为“不宜出门”,因为热天大湿度不适合户外活动。
回到晴天的节点,接下来我们选择中温作为子节点。中温下无论湿度和风力如何都可以出门,因此结果为“适宜出门”。
以冷为例,我们可以选择风力作为子节点。风力又可以分为无和有两个分支。根据计算得到的信息增益,我们选择风力作为子节点。
以无风为例,我们可以将结果设置为“适宜出门”,因为冷天无风适合户外活动。
以有风为例,我们可以将结果设置为“不宜出门”,因为有风天气会影响户外活动的安全性。
回到根节点,我们可以选择多云和雨天两个分支。以多云为例,我们可以选择湿度作为子节点。湿度又可以分为正常和大两个分支。根据计算得到的信息增益,我们选择湿度作为子节点。
以正常为例,我们可以选择风力作为子节点。风力又可以分为无和有两个分支。根据计算得到的信息增益,我们选择风力作为子节点。
以无风为例,我们可以将结果设置为“适宜出门”,因为多云正常湿度无风适合户外活动。
以有风为例,我们可以将结果设置为“不宜出门”,因为有风天气会影响户外活动的安全性。
以大为例,我们可以将结果设置为“不宜出门”,因为多云大湿度不适合户外活动。
回到根节点,我们可以选择雨天作为最后一个分支。由于雨天的属性值已经确定,我们可以将结果设置为“不宜出门”,因为雨天不适合户外活动。
这就是一个按照Information Gain构造的天气决策树。
阅读全文