第一个任务,请大家使用白酒数据集的全部条件特征,对这个数据集的样本进行求取,他们的优势关系类。在这个基础之上,再计算三个决策类,也就是三种标签样本集在所有13个条件属性的下近似。第二个任务,从这13个属性集当中最后一个开始逐一去掉,每去掉一个,再次计算这三个类标签的样本集在剩下12个条件属性的下近似。看这三个下进式与原来13个条件属性下的下近似是否相同。依次类推,直到找到一个条件属性集合使得三个类标记的样本集合具有相同的下近似为止。第三个任务,用找到的条件属性集采用前天的K-means方法对所有的样本进行一个聚类学习。然后把聚类结果和原来的类标记进行对比计算聚类精度。
时间: 2024-04-19 09:28:10 浏览: 62
4500张瓶装白酒外观瑕疵品检测数据集带json格式标签.zip
对于第一个任务,您想要使用白酒数据集的全部条件特征来计算样本的优势关系类。这可以通过以下步骤完成:
1. 使用白酒数据集的全部条件特征计算样本的优势关系类。您可以使用适当的算法或方法来计算样本之间的关系。
2. 然后,计算三个决策类(三种标签样本集)在所有13个条件属性的下近似。这意味着您需要计算每个决策类在这些条件属性下的近似关系。
对于第二个任务,您需要逐步去掉条件属性并计算三个类标签的样本集在剩下的属性下的近似关系。具体步骤如下:
1. 从13个属性集中选择最后一个属性,将其从条件属性集中移除。
2. 使用剩下的12个条件属性计算三个类标签的样本集在这些属性下的近似关系。
3. 检查这三个下近似是否与原来13个条件属性下的下近似相同。
4. 如果相同,则找到了一个条件属性集合,满足三个类标记的样本集合具有相同的下近似。
5. 如果不同,则重复上述步骤,继续逐步去掉一个属性,直到找到满足条件的属性集合。
对于第三个任务,您想要使用找到的条件属性集合来进行聚类学习,并将聚类结果与原来的类标记进行比较以计算聚类精度。这可以通过以下步骤完成:
1. 使用找到的条件属性集合对所有样本进行K-means聚类学习。
2. 将聚类结果与原来的类标记进行对比,计算聚类精度,可以使用适当的指标(如准确率、召回率、F1值等)来评估精度。
请注意,上述步骤只是一种可能的方法,具体的实现方式可能根据您使用的算法和工具而有所不同。
阅读全文