Pd.dataframe
时间: 2024-06-09 10:03:35 浏览: 184
Pandas DataFrame是Python中pandas库中的核心数据结构,它是一个二维表格型的数据结构,类似于电子表格或SQL表。DataFrame用于存储和处理表格数据,每列可以有不同的数据类型,包括数值、字符串、日期时间等。它具有丰富的功能,支持数据清洗、转换、分组、合并、筛选等多种操作。
以下是Pandas DataFrame的一些关键特性:
1. **列名**:每个列都有一个明确的名字,可以通过列名进行访问和操作。
2. **行索引** 和 **列索引**:默认情况下,每一行都有一个唯一的索引,而列则是按其名称进行索引。
3. **数据对齐**:当进行数学运算时,DataFrame会自动进行列对齐,确保相同列名的数据进行计算。
4. **分块存储**:对于大型数据集,DataFrame支持分块存储,提高内存效率。
5. **数据透视表**:可以轻松创建数据透视表进行复杂汇总和分析。
如果你想要使用Pandas DataFrame,你可以这样做:
```python
import pandas as pd
# 创建DataFrame
data = {'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [28, 35, 40],
'City': ['New York', 'Paris', 'London']}
df = pd.DataFrame(data)
# 访问数据
print(df['Name']) # 输出:Name Alice Bob Charlie
# Name
0 Alice
1 Bob
2 Charlie
# 操作数据
df.groupby('City').mean() # 对City列进行分组并计算平均值
```
阅读全文