Data<-read.table(file="模式甄别模拟数据1.txt",header=TRUE,sep=",") library("mclust") EMfit<-Mclust(data=Data[,-3]) par(mfrow=c(2,2)) Data$ker.scores<-EMfit$uncertainty Data.Sort<-Data[order(x=Data$ker.scores,decreasing=TRUE),] P<-0.1 N<-length(Data[,1]) NoiseP<-head(Data.Sort,trunc(N*P)) colP<-ifelse(1:N %in% rownames(NoiseP),2,1) plot(Data[,1:2],main="EM聚类的模式诊断结果(10%)",xlab="x1",ylab="x2",pch=Data[,3]+1,cex=0.8,col=colP) library("ROCR") pd<-prediction(Data$ker.scores,Data$y) pf1<-performance(pd,measure="rec",x.measure="rpp") pf2<-performance(pd,measure="prec",x.measure="rec") plot(pf1,main="模式甄别的累计回溯精度曲线") plot(pf2,main="模式甄别的决策精度和回溯精度曲线") P<-0.25 NoiseP<-head(Data.Sort,trunc(N*P)) colP<-ifelse(1:N %in% rownames(NoiseP),2,1) plot(Data[,1:2],main="EM聚类的模式诊断结果(25%)",xlab="x1",ylab="x2",pch=Data[,3]+1,cex=0.8,col=colP)
时间: 2023-06-23 16:08:26 浏览: 128
bootstrap-table-fixed-columns.js
这段代码是用R语言进行数据处理和可视化的操作。首先将模拟数据读入到R中,然后使用mclust包中的Mclust函数进行EM聚类分析,得到每个数据点属于每个聚类的不确定性得分。接着根据不确定性得分对数据点进行排序,并选取不确定性得分最高的一定比例的数据作为噪声数据。根据噪声数据的位置,对数据点进行着色,并用plot函数进行可视化展示。最后,使用ROCR包中的prediction和performance函数,绘制模式甄别的累计回溯精度曲线和决策精度和回溯精度曲线。
阅读全文