【基础】Pandas:Series和DataFrame数据结构详解
发布时间: 2024-06-26 12:03:18 阅读量: 86 订阅数: 125
pandas-1-Series和DataFrame介绍
![【基础】Pandas:Series和DataFrame数据结构详解](https://img-blog.csdnimg.cn/20201227143354173.png)
# 2.1 Series的基本操作
### 2.1.1 创建Series
创建Series有两种主要方法:
- 使用`pd.Series()`函数:
```python
import pandas as pd
data = [1, 2, 3, 4, 5]
series = pd.Series(data)
```
- 使用字典:
```python
data = {'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 5}
series = pd.Series(data)
```
### 2.1.2 索引和切片
Series具有索引,可以用来访问和操作单个元素。索引可以是整数(位置索引)或标签(名称索引)。
- 使用位置索引:
```python
series[0] # 获取第一个元素
series[-1] # 获取最后一个元素
series[1:3] # 获取第二个和第三个元素
```
- 使用名称索引:
```python
series['a'] # 获取具有标签'a'的元素
series[['a', 'c']] # 获取具有标签'a'和'c'的元素
```
### 2.1.3 数据类型和转换
Series可以存储不同数据类型的数据,包括整数、浮点数、字符串和布尔值。
- 获取数据类型:
```python
series.dtype
```
- 转换数据类型:
```python
series = series.astype(int) # 将所有元素转换为整数
series = series.astype(str) # 将所有元素转换为字符串
```
# 2. Series数据结构详解
Series是Pandas库中一维数据结构,用于存储一组具有相同数据类型的有序数据。与列表不同,Series具有索引,允许通过索引值快速访问元素。
### 2.1 Series的基本操作
#### 2.1.1 创建Series
创建Series有以下几种方法:
```python
# 从列表创建
import pandas as pd
data = [1, 2, 3, 4, 5]
series = pd.Series(data)
# 从字典创建
data = {'a': 1, 'b': 2, 'c': 3}
series = pd.Series(data)
# 从标量创建
series = pd.Series(5, index=['a', 'b', 'c'])
```
#### 2.1.2 索引和切片
Series具有索引,可以是整数、字符串或其他对象。通过索引值可以快速访问元素:
```python
# 获取索引为2的元素
series[2]
# 通过切片获取元素
series[1:3]
```
#### 2.1.3 数据类型和转换
Series可以存储不同数据类型的元素,包括整型、浮点型、字符串和布尔型。可以使用`dtype`属性获取数据类型,并使用`astype()`方法转换数据类型:
```python
# 获取数据类型
series.dtype
# 转换为浮点型
series.astype(float)
```
### 2.2 Series的高级操作
#### 2.2.1 缺失值处理
Series中可能包含缺失值,可以使用`isnull()`和`fillna()`方法处理缺失值:
```python
# 获取缺失值
series.isnull()
# 填充缺失值
series.fillna(0)
```
#### 2.2.2 数据分组和聚合
Series可以根据索引值进行分组,并使用聚合函数(如`sum()`、`mean()`)对分组数据进行聚合:
```python
# 根据索引值分组
series.groupby(index).sum()
# 根据自定义函数分组
series.groupby(lambda x: x % 2).mean()
```
#### 2.2.3 排序和筛选
Series可以根据索引值或元素值进行排序,并使用布尔索引筛选元素:
```python
# 根据索引值排序
series.sort_index()
# 根据元素值排序
series.sort_values()
# 使用布尔索引筛选元素
series[series > 3]
```
# 3.1 DataFrame的基本操作
#### 3.1.1 创建DataFrame
DataFrame可以通过多种方式创建,最常见的方法是使用字典或列表:
```python
import pandas as pd
# 使用字典创建DataFrame
data = {'Name': ['John', 'Mary', 'Peter'], 'Age': [20, 25, 30]
```
0
0