R语言 subset()函数用法
时间: 2024-04-26 11:18:10 浏览: 197
R语言中的subset()函数用于从数据框中选择满足特定条件的观测值或变量。它的基本语法如下:
subset(x, subset, select, drop = FALSE, ...)
参数说明:
- x:要进行子集操作的数据框或向量。
- subset:一个逻辑表达式,用于指定选择哪些观测值。只有满足该表达式的观测值才会被选择。
- select:一个向量,用于指定选择哪些变量。只有包含在该向量中的变量才会被选择。
- drop:一个逻辑值,用于指定是否删除不包含在select参数中的变量。默认为FALSE,即不删除。
- ...:其他参数。
下面是一些示例:
1. 选择满足特定条件的观测值:
```
data <- data.frame(x = 1:5, y = letters[1:5])
subset(data, x > 3)
```
输出:
```
x y
4 4 d
5 5 e
```
2. 选择特定的变量:
```
data <- data.frame(x = 1:5, y = letters[1:5], z = LETTERS[1:5])
subset(data, select = c(x, z))
```
输出:
```
x z
1 1 A
2 2 B
3 3 C
4 4 D
5 5 E
```
3. 同时选择满足条件的观测值和特定的变量:
```
data <- data.frame(x = 1:5, y = letters[1:5], z = LETTERS[1:5])
subset(data, x > 2, select = c(x, z))
```
输出:
```
x z
3 3 C
4 4 D
5 5 E
```
阅读全文