DataFrame对象
时间: 2024-01-07 20:49:08 浏览: 26
DataFrame 是 Pandas 库中的一个主要数据结构,可以用于处理结构化数据,类似于 Excel 表格或 SQL 数据库中的表格。DataFrame 是一个二维表格,其中每一行代表一条记录,每一列代表一个属性。每列可以是不同的数据类型(如整数、浮点数、字符串等)。
在 DataFrame 中,每一行都有一个唯一的标识符,称为索引(index),每一列也有一个名称,称为列名(column name)。可以用索引和列名来访问 DataFrame 中的数据。
DataFrame 可以从多种数据源创建,如 CSV 文件、Excel 文件、数据库查询结果等。可以使用 Pandas 提供的函数对 DataFrame 进行各种数据操作,如选择子集、添加或删除行列、数据清洗、数据聚合等。
下面是一个简单的 DataFrame 示例:
```
import pandas as pd
data = {
'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [25, 30, 35, 40],
'gender': ['F', 'M', 'M', 'M']
}
df = pd.DataFrame(data)
print(df)
```
输出:
```
name age gender
0 Alice 25 F
1 Bob 30 M
2 Charlie 35 M
3 David 40 M
```
这个 DataFrame 包含了四个人的姓名、年龄和性别信息。其中每一行都有一个唯一的索引(0-3),每一列都有一个名称。可以使用列名来选择单个列或多个列,使用 loc 或 iloc 来选择特定的行。