pandas 数据结构
时间: 2024-01-02 11:23:00 浏览: 29
Pandas是一个强大的数据分析工具,提供了多种数据结构来处理和操作数据。其中,最常用的数据结构有Series、DataFrame和Panel。
1. Series是一维标记数组,可以存储任何数据类型。它由两个数组组成,一个用于存储数据值,另一个用于存储与数据关联的标签(索引)。可以使用以下代码创建一个Series对象:
```python
import pandas as pd
data = [1, 2, 3, 4, 5]
s = pd.Series(data)
print(s)
```
输出结果为:
```
0 1
1 2
2 3
3 4
4 5
dtype: int64
```
2. DataFrame是一个二维表格数据结构,类似于Excel或SQL中的表。它由行和列组成,每列可以是不同的数据类型。可以使用以下代码创建一个DataFrame对象:
```python
import pandas as pd
data = {'Name': ['Alex', 'Bob', 'Bauer'],
'Age': [25, 26, 24]}
df = pd.DataFrame(data)
print(df)
```
输出结果为:
```
Name Age
0 Alex 25
1 Bob 26
2 Bauer 24
```
3. Panel是一个三维数据结构,可以看作是DataFrame的容器。它由多个DataFrame组成,每个DataFrame代表一个二维表格。可以使用以下代码创建一个Panel对象:
```python
import pandas as pd
data = {'Item1': pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]}),
'Item2': pd.DataFrame({'C': [7, 8, 9], 'D': [10, 11, 12]})}
p = pd.Panel(data)
print(p)
```
输出结果为:
```
<class 'pandas.core.panel.Panel'>
Dimensions: 2 (items) x 3 (major_axis) x 2 (minor_axis)
Items axis: Item1 to Item2
Major_axis axis: 0 to 2
Minor_axis axis: A to B
```