python中DataFrame定义
时间: 2024-09-09 13:00:50 浏览: 44
Python 实现DataFrame数据的排序或排名 Python源码
在Python的pandas库中,DataFrame是一个二维表格型的数据结构,类似于SQL表或电子表格中的数据集。它是pandas的核心数据结构之一,用于存储和操作大量结构化数据。
DataFrame由行(index)和列(columns)组成,每列可以包含不同类型的数据。每个元素都有对应的索引位置。DataFrame有以下几个关键特性:
1. **Series** 类似于一维数组,但它带有一个默认的行标签。
2. **Indexing** 支持多种索引方式,包括整数、标签或者混合。
3. **Hierarchical indexing** 允许设置多级索引,这对于处理大型数据集尤其有用。
4. **Operations** 包含丰富的数学、统计和数据清洗功能,如计算聚合、排序、合并等。
5. **Pivot tables** 可以方便地进行数据透视分析。
创建DataFrame的基本语法如下:
```python
import pandas as pd
data = {'Name': ['John', 'Anna', 'Peter', 'Linda'],
'Age': [28, 24, 35, 30],
'City': ['New York', 'Paris', 'Berlin', 'Tokyo']}
df = pd.DataFrame(data)
```
这里,`data`字典是DataFrame的基础数据,`pd.DataFrame()`函数用于创建DataFrame。
阅读全文