r语言对泰坦尼克号数据使用cmeans函数的代码
时间: 2024-03-10 18:50:36 浏览: 17
使用 cmeans 函数进行聚类,需要事先将数据进行处理,将字符型数据转为数值型数据,并去除缺失值。以下是一个在 R 语言中使用 cmeans 函数对泰坦尼克号数据进行聚类的示例代码:
```R
# 导入数据
data(titanic)
# 去除缺失值
titanic <- na.omit(titanic)
# 将字符型数据转为数值型数据
titanic$sex <- ifelse(titanic$sex == "male", 1, 0)
titanic$embarked <- ifelse(titanic$embarked == "S", 1,
ifelse(titanic$embarked == "C", 2, 3))
# 提取数值型数据
titanic_num <- titanic[, c(2, 3, 5, 6, 8)]
# 数据标准化
titanic_scale <- scale(titanic_num)
# 聚类
library(e1071)
result <- cmeans(titanic_scale, centers = 2, m = 1.5, verbose = TRUE)
```
其中,`data(titanic)` 是导入泰坦尼克号数据集,`na.omit()` 是去除缺失值,`ifelse()` 是将字符型数据转为数值型数据,`scale()` 是将数据进行标准化,`cmeans()` 是进行聚类,`centers` 是聚类的个数,`m` 是模糊指数,`verbose` 是是否显示迭代过程。聚类结果存储在 `result` 中。