dataframe类数据结构
时间: 2023-10-12 14:19:24 浏览: 91
浅析pandas 数据结构中的DataFrame
DataFrame 是 Pandas 库中的一种数据结构,它是一个二维的表格数据结构,每一列可以是不同的数据类型(例如数字、字符串、布尔值等)。DataFrame 可以看作是由多个 Series 组成的,每一列都是一个 Series。
DataFrame 的特点:
1. 二维表格结构,可以方便地进行行列操作。
2. 可以处理不同类型的数据,如数值型、字符型、时间型等。
3. 具有丰富的数据处理和清洗功能,如数据筛选、排序、合并、分组等。
在 Pandas 中,DataFrame 可以由多种方式创建,例如从 CSV 文件、Excel 文件、SQL 数据库等读取数据,也可以通过手动创建来生成 DataFrame。以下是一个简单的示例:
```python
import pandas as pd
# 创建一个 DataFrame
data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [25, 32, 18, 47],
'gender': ['F', 'M', 'M', 'M']}
df = pd.DataFrame(data)
```
上述代码中,我们通过传入一个字典来创建一个 DataFrame,其中字典的 key 为列名,value 为该列的数据。最终生成的 DataFrame 如下所示:
```
name age gender
0 Alice 25 F
1 Bob 32 M
2 Charlie 18 M
3 David 47 M
```
阅读全文