x=read.table("D:\大二下\多元统计分析\shuju\距离判别.txt",header = T) x class=factor(x[,1])#转化为因子型 x=x[,-1] g=length(levels(class))#类别数 L=ncol(x)#指标数 nx=nrow(x)#样品数 mu=matrix(0,nrow=g,ncol=L)#均值 s=list()#协方差 for (i in 1:g) { mu[i,]=colMeans(x[class==i,]) s[[i]]=cov(x[class==i,]) } shf=matrix(0,nrow=L,ncol=L) for (i in 1:length(s)) { n=length(class[class==i]) shf=shf+(n-1)s[[i]] } sh=shf/(nx-g) D=matrix(0,nrow = nx,ncol=g)#马氏平方距离 for (i in 1:g) { for (j in 1:nx) { #D[j,i]=as.matrix(x[j,]-mu[i,])%%solve(sh)%%t(x[j,]-mu[i,]) D[j,i]=mahalanobis(as.matrix(x[j,]),mu[i,],sh) } } D x=c(8.06,231.03,14.41,5.72,6.15) x1=c(9.89,409.42,19.47,5.19,10.49) matrix(x,ncol=L) mahalanobis(matrix(x1,ncol=L),mu[1,],sh) #回代估计法 lei=c() for (i in 1:nx) { lei[i]=which.min(D[i,]) } lei for (i in 1:nx) { n[i]=ifelse(class[i]==lei[i],0,1) } p=sum(n)/nx#回代误判率 #交叉确认估计法 y=read.table("D:\大二下\多元统计分析\shuju\距离判别.txt",header = T) L=ncol(y[,-1])#指标数 nx=nrow(y)#样品数 lei=c() nn=c() for (k in 1:nx) { x=y[-k,] class=factor(x[,1]) g=length(levels(class))#类别数 x=x[,-1] nnx=nx-1 mu=matrix(0,nrow=g,ncol=L)#均值 s=list()#协方差 for (i in 1:g) { mu[i,]=colMeans(x[class==i,]) s[[i]]=cov(x[class==i,]) } shf=matrix(0,nrow=L,ncol=L) for (j in 1:length(s)) { n=length(class[class==j]) shf=shf+(n-1)s[[j]] } sh=shf/(nnx-g) D=c()#剔除样品的马氏平方距离 for (m in 1:g) { #D[m]=as.matrix(y[k,-1]-mu[m,])%%solve(sh)%%t(y[k,-1]-mu[m,]) D[m]=mahalanobis(as.matrix(y[k,-1]),mu[m,],sh) } lei[k]=which.min(D)#剔除样本判断的所属类别 nn[k]=ifelse(y[k,1]==lei[k],0,1)#误判时n为1 } x[which(class!=lei)] p=sum(nn)/nx#交叉确认误判率 nn lei利用此代码实现多个总体的bayes判别(假定各个总体的协方差相等)
时间: 2024-02-28 17:57:03 浏览: 14
这段代码是实现多元统计分析中的距离判别方法,并没有实现贝叶斯判别法。要实现贝叶斯判别法,需要先计算各个总体的先验概率和条件概率密度函数,最终根据贝叶斯公式计算后验概率,选择概率最大的类别作为分类结果。具体实现可以参考如下代码:
```R
x <- read.table("D:\大二下\多元统计分析\shuju\距离判别.txt",header = T)
class <- factor(x[,1])
x <- x[,-1]
g <- length(levels(class)) # 类别数
L <- ncol(x) # 指标数
nx <- nrow(x) # 样品数
mu <- matrix(0, nrow=g, ncol=L) # 均值
s <- list() # 协方差
for (i in 1:g) {
mu[i,] <- colMeans(x[class==i,])
s[[i]] <- cov(x[class==i,])
}
sh <- s[[1]] # 假定各个总体的协方差相等
prior_prob <- rep(1/g, g) # 假定各个总体的先验概率相等
cond_pdf <- function(x, mu, sh) { # 计算多元正态分布的条件概率密度函数
dnorm(x, mean=mu, sd=sqrt(diag(sh)))
}
bayes_classifier <- function(x, prior_prob, mu, sh) { # 贝叶斯分类器
post_prob <- prior_prob * apply(mu, 1, function(m) cond_pdf(x, m, sh))
post_prob / sum(post_prob)
}
x1 <- c(8.06,231.03,14.41,5.72,6.15) # 待分类样本
result <- bayes_classifier(x1, prior_prob, mu, sh) # 分类结果
result
```
这个代码中,先计算各个总体的均值和协方差矩阵,假定各个总体的协方差相等。然后定义一个函数 `cond_pdf`,用于计算多元正态分布的条件概率密度函数。最后定义一个贝叶斯分类器函数 `bayes_classifier`,根据贝叶斯公式计算后验概率,选择概率最大的类别作为分类结果。最后对一个待分类样本 `x1` 进行分类,得到分类结果 `result`。