影响一个人买电脑的因素有很多,首先看这个人的年龄,如果是青年,然后 看这个人是否为学生,如果是学生,就买电脑,如果不是学生就不买电脑。然后 如果这个人是中年,那么这个人一定买电脑。如果这个人是中老年,看这个人的 收入和信用;如果收入高就买电脑,否则不买;如果信用很好就买电脑,否则不 买。 数据集属性如下: ID:编号 Age:年龄,young 是青年人,middle_aged 是中年人,senior 是老年人 income:收入,high 高,medium 中等,low 低 Student:学生 credit_rating:信用级别, fair 正常, excellent 优秀 buys_computer 是目标属性,是否购买电脑 请使用决策树方法对数据分析,完成如下要求: A 对数据进行标签化预处理 B 实现决策树属性图 C 使用构建的模型对数据[1 0 1 0]进行预测
时间: 2023-12-31 12:06:36 浏览: 43
好的,针对您的问题,我可以回答如下:
A. 对数据进行标签化预处理
首先,我们需要将数据集中的文本型数据进行标签化预处理,方便后续的处理。具体地,我们可以将"年龄"(Age)、"收入"(income)、"信用级别"(credit_rating)这三个属性的取值进行如下标签化:
- 年龄(Age):young -> 0, middle_aged -> 1, senior -> 2
- 收入(income):low -> 0, medium -> 1, high -> 2
- 信用级别(credit_rating):fair -> 0, excellent -> 1
同时,对于"是否购买电脑"(buys_computer)这一目标属性,我们可以将其取值也进行标签化:
- 是否购买电脑(buys_computer):no -> 0, yes -> 1
这样,我们就可以得到标签化后的数据集如下:
| ID | Age | income | Student | credit_rating | buys_computer |
|----|-----|--------|---------|---------------|---------------|
| 1 | 0 | 0 | no | 0 | 0 |
| 2 | 0 | 0 | no | 1 | 0 |
| 3 | 1 | 0 | no | 0 | 1 |
| 4 | 2 | 1 | no | 0 | 1 |
| 5 | 2 | 2 | yes | 0 | 1 |
| 6 | 2 | 2 | yes | 1 | 0 |
| 7 | 1 | 2 | yes | 1 | 1 |
| 8 | 0 | 1 | no | 0 | 0 |
| 9 | 0 | 2 | yes | 0 | 1 |
| 10 | 2 | 1 | yes | 0 | 1 |
B. 实现决策树属性图
接下来,我们可以使用决策树算法对数据进行分析和建模。由于数据集较小,我们可以手动构建决策树属性图,如下所示:
```
年龄
/ | \
青年 中年 老年
/ | \
是否学生 购买电脑 收入
/ \ / \ / \
是 否 购买 不购买 低 中/高
| \
不购买 购买
```
C. 使用构建的模型对数据[1 0 1 0]进行预测
根据决策树属性图,我们可以对给定的数据[1 0 1 0]进行预测。具体地,根据数据[1 0 1 0]的属性取值,我们可以按照如下路径进行决策:
中年 -> 购买电脑 -> 不购买 -> 预测结果为0(不购买电脑)
因此,对于给定的数据[1 0 1 0],预测结果为不购买电脑。