x=read.table("D:\\大二下\\多元统计分析\\shuju\\距离判别.txt",header = T) x class=factor(x[,1])#转化为因子型 x=x[,-1] g=length(levels(class))#类别数 L=ncol(x)#指标数 nx=nrow(x)#样品数 mu=matrix(0,nrow=g,ncol=L)#均值 s=list()#协方差 for (i in 1:g) { mu[i,]=colMeans(x[class==i,]) s[[i]]=cov(x[class==i,]) } shf=matrix(0,nrow=L,ncol=L) for (i in 1:length(s)) { n=length(class[class==i]) shf=shf+(n-1)*s[[i]] } sh=shf/(nx-g) D=matrix(0,nrow = nx,ncol=g)#马氏平方距离 for (i in 1:g) { for (j in 1:nx) { #D[j,i]=as.matrix(x[j,]-mu[i,])%*%solve(sh)%*%t(x[j,]-mu[i,]) D[j,i]=mahalanobis(as.matrix(x[j,]),mu[i,],sh) } } D x=c(8.06,231.03,14.41,5.72,6.15) x1=c(9.89,409.42,19.47,5.19,10.49) matrix(x,ncol=L) mahalanobis(matrix(x1,ncol=L),mu[1,],sh) #回代估计法 lei=c() for (i in 1:nx) { lei[i]=which.min(D[i,]) } lei for (i in 1:nx) { n[i]=ifelse(class[i]==lei[i],0,1) } p=sum(n)/nx#回代误判率 #交叉确认估计法 y=read.table("D:\\大二下\\多元统计分析\\shuju\\距离判别.txt",header = T) L=ncol(y[,-1])#指标数 nx=nrow(y)#样品数 lei=c() nn=c() for (k in 1:nx) { x=y[-k,] class=factor(x[,1]) g=length(levels(class))#类别数 x=x[,-1] nnx=nx-1 mu=matrix(0,nrow=g,ncol=L)#均值 s=list()#协方差 for (i in 1:g) { mu[i,]=colMeans(x[class==i,]) s[[i]]=cov(x[class==i,]) } shf=matrix(0,nrow=L,ncol=L) for (j in 1:length(s)) { n=length(class[class==j]) shf=shf+(n-1)*s[[j]] } sh=shf/(nnx-g) D=c()#剔除样品的马氏平方距离 for (m in 1:g) { #D[m]=as.matrix(y[k,-1]-mu[m,])%*%solve(sh)%*%t(y[k,-1]-mu[m,]) D[m]=mahalanobis(as.matrix(y[k,-1]),mu[m,],sh) } lei[k]=which.min(D)#剔除样本判断的所属类别 nn[k]=ifelse(y[k,1]==lei[k],0,1)#误判时n为1 } x[which(class!=lei)] p=sum(nn)/nx#交叉确认误判率 nn lei.如果假定各个总体的协方差不相等,又该如何修改距离判别的代码?
时间: 2024-02-28 14:56:39 浏览: 142
MATLAB学习笔记 - 读取txt、mat、Excel等文件.docx
如果假定各个总体的协方差不相等,则需要使用不同的协方差矩阵进行判别。具体修改如下:
1. 计算每个类别的协方差矩阵,不再使用总体协方差矩阵。
2. 在计算马氏距离时,代入各自的协方差矩阵进行计算。
下面是修改后的代码:
```R
x=read.table("D:\\大二下\\多元统计分析\\shuju\\距离判别.txt",header = T)
x class=factor(x[,1])#转化为因子型
x=x[,-1]
g=length(levels(class))#类别数
L=ncol(x)#指标数
nx=nrow(x)#样品数
mu=matrix(0,nrow=g,ncol=L)#均值
s=list()#协方差
for (i in 1:g) {
mu[i,]=colMeans(x[class==i,])
s[[i]]=cov(x[class==i,])
}
lei = c()
D=matrix(0,nrow = nx,ncol=g)#马氏平方距离
for (i in 1:g) {
for (j in 1:nx) {
D[j,i]=mahalanobis(as.matrix(x[j,]),mu[i,],s[[i]])
}
}
x=c(8.06,231.03,14.41,5.72,6.15)
x1=c(9.89,409.42,19.47,5.19,10.49)
matrix(x,ncol=L)
mahalanobis(matrix(x1,ncol=L),mu[1,],s[[1]]) #回代估计法
lei=c()
for (i in 1:nx) {
lei[i]=which.min(D[i,])
}
lei
for (i in 1:nx) {
n[i]=ifelse(class[i]==lei[i],0,1)
}
p=sum(n)/nx#回代误判率
#交叉确认估计法
y=read.table("D:\\大二下\\多元统计分析\\shuju\\距离判别.txt",header = T)
L=ncol(y[,-1])#指标数
nx=nrow(y)#样品数
lei=c()
nn=c()
for (k in 1:nx) {
x=y[-k,]
class=factor(x[,1])
g=length(levels(class))#类别数
x=x[,-1]
nnx=nx-1
mu=matrix(0,nrow=g,ncol=L)#均值
s=list()#协方差
for (i in 1:g) {
mu[i,]=colMeans(x[class==i,])
s[[i]]=cov(x[class==i,])
}
D=c()#剔除样品的马氏平方距离
for (m in 1:g) {
D[m]=mahalanobis(as.matrix(y[k,-1]),mu[m,],s[[m]])
}
lei[k]=which.min(D)#剔除样本判断的所属类别
nn[k]=ifelse(y[k,1]==lei[k],0,1)#误判时n为1
}
p=sum(nn)/nx#交叉确认误判率
```
需要注意的是,当协方差不相同时,每个类别的协方差矩阵都是不同的,需要分别计算。在代码中,我使用`s[[i]]=cov(x[class==i,])`计算了每个类别的协方差矩阵,然后在计算马氏距离时,代入`s[[i]]`即可。
阅读全文