针对以下数据集进行分析和后续操作。 > > + + + + > > > > + options(digits=2) Student <- c("John Davis", "Angela Williams", "Bullwinkle Moose", "David Jones", "Janice Markhammer", "Cheryl Cushing", "Reuven Ytzrhak", "Greg Knox", "Joel England", "Mary Rayburn") Math <- c(502, 600, 412, 358, 495, 512, 410, 625, 573, 522) Science <- c(95, 99, 80, 82, 75, 85, 80, 95, 89, 86) English <- c(25, 22, 18, 15, 20, 28, 15, 30, 27, 18) roster <- data.frame(Student, Math, Science, English, stringsAsFactors=FALSE) 以上为什么要执行stringsAsFactors=FALSE?说明原因 如何进行数据标准化。将该列的列名命名为z。 Z<-scale(x) 将标准化后的数据对每行求均值,并保存为新的变量名score。
时间: 2024-02-13 19:04:07 浏览: 82
数据挖掘实训报告----精品模板.pdf
执行 `stringsAsFactors=FALSE` 是为了避免将字符型变量转换为因子型变量,因为在进行数据处理和分析时,字符型变量的处理方法与因子型变量不同,容易引起错误。
要进行数据标准化,可以使用 `scale()` 函数,该函数可以将数据标准化为均值为0,标准差为1的形式。因此可以执行以下代码进行标准化并将列名命名为z:
```
z <- scale(roster[,2:4])
colnames(z) <- c("z_Math", "z_Science", "z_English")
```
要对每行求均值,可以使用 `apply()` 函数,其中 `MARGIN=1` 表示对行进行操作,`FUN=mean` 表示对每行求均值:
```
score <- apply(z, MARGIN=1, FUN=mean)
```
执行上述代码后,`score` 变量将保存每行标准化后的数据的均值。
阅读全文