DATAFRAME 的数据结构
时间: 2023-10-21 09:36:22 浏览: 96
数据结构
DataFrame 是 Pandas 库中的一个重要数据结构,它是由不同的列组成的表格数据结构。每一列可以是不同的数据类型,如字符串、整数、浮点数等。DataFrame 通常用于数据清洗、数据分析和数据可视化等任务。
DataFrame 可以通过以下方式创建:
1. 从 CSV 文件、Excel 文件、数据库、JSON 文件等数据源中读取数据;
2. 从 Python 字典、Numpy 数组等数据结构中创建 DataFrame。
DataFrame 的主要属性包括:
1. `index`:DataFrame 的行标签;
2. `columns`:DataFrame 的列标签;
3. `values`:DataFrame 中的数据;
4. `shape`:DataFrame 的形状,即行数和列数;
5. `dtypes`:DataFrame 中每列的数据类型;
6. `info()`:DataFrame 的信息摘要,包括每列的非空值数量和数据类型等信息;
7. `describe()`:DataFrame 的描述性统计信息,包括每列的计数、平均值、标准差、最小值、25% 分位数、50% 分位数、75% 分位数和最大值等。
DataFrame 支持许多操作,例如选择、过滤和转换等。可以使用 `loc` 和 `iloc` 属性来选择 DataFrame 中的行和列,使用 `drop()` 方法来删除行或列,使用 `groupby()` 方法来对 DataFrame 进行分组,使用 `merge()` 方法来合并两个 DataFrame 等。
阅读全文