r语言dataframe的用法
时间: 2023-11-18 14:08:33 浏览: 159
一图诠释R语言合并dataframe的各种姿势
R语言中的data.frame是一种常用的数据结构,类似于表格,由多个列组成,每列的数据类型可以不同。下面介绍data.frame的常用用法:
1. 创建data.frame
可以使用data.frame()函数创建一个data.frame对象,例如:
```
df <- data.frame(name=c("Alice", "Bob", "Charlie"), age=c(25, 30, 35), height=c(165, 175, 180))
```
这里创建了一个包含三列的data.frame对象,分别是name、age和height,每列分别包含三个元素。
2. 访问data.frame
可以使用$符号或者[[]]运算符访问data.frame中的某一列,例如:
```
df$name
df[["age"]]
```
可以使用[行索引,列索引]的方式访问data.frame中的某个元素,例如:
```
df[2,3]
```
3. 添加、删除和修改列
可以使用$符号添加新的列,例如:
```
df$weight <- c(50, 70, 80)
```
可以使用[[]]运算符修改某一列的值,例如:
```
df[["height"]] <- c(160, 170, 175)
```
可以使用$符号删除某一列,例如:
```
df$weight <- NULL
```
4. 子集操作
可以使用[行索引,列索引]的方式进行子集操作,例如:
```
df[1:2,] #选择前两行
df[,1:2] #选择前两列
df[df$age>30,] #选择年龄大于30的行
df[df$name=="Bob",] #选择名字是Bob的行
```
5. 汇总和统计
可以使用summary()函数对data.frame进行汇总和统计,例如:
```
summary(df)
```
可以使用aggregate()函数对data.frame进行分组和统计,例如:
```
aggregate(height ~ age, data=df, mean)
```
这里对df按照age进行分组,并计算每组的height均值。
阅读全文