【基础】Pandas数据结构(Series, DataFrame)
发布时间: 2024-06-27 20:17:19 阅读量: 65 订阅数: 113
浅析pandas 数据结构中的DataFrame
![【基础】Pandas数据结构(Series, DataFrame)](https://ask.qcloudimg.com/http-save/yehe-5669851/lifus0nfda.jpeg)
# 1. Pandas数据结构基础**
Pandas是一个强大的Python库,用于处理和分析数据。它提供了两种主要的数据结构:Series和DataFrame。Series是一个一维数组,而DataFrame是一个二维表格,其中行和列分别称为索引和列。
Pandas数据结构基于NumPy数组,这使得它们具有高效的数值计算能力。它们还提供了丰富的函数和方法,用于数据操作、索引和切片、聚合和分组。
# 2. Series数据结构
### 2.1 Series的创建和初始化
Series是一种一维数组数据结构,可以存储不同数据类型的元素,包括数字、字符串、布尔值等。创建Series有以下几种方式:
1. **从列表或元组创建:**
```python
import pandas as pd
# 从列表创建Series
data = [1, 2, 3, 4, 5]
series = pd.Series(data)
# 从元组创建Series
data = (1, 2, 3, 4, 5)
series = pd.Series(data)
```
2. **从字典创建:**
```python
# 从字典创建Series
data = {'a': 1, 'b': 2, 'c': 3}
series = pd.Series(data)
```
3. **使用pd.Series()函数:**
```python
# 使用pd.Series()函数创建Series
series = pd.Series([1, 2, 3, 4, 5], index=['a', 'b', 'c', 'd', 'e'])
```
### 2.2 Series的索引和数据操作
Series具有索引功能,可以方便地访问和操作数据。
**索引操作:**
* **获取索引:** `series.index`
* **设置索引:** `series.index = new_index`
* **重命名索引:** `series.rename_axis(new_name, axis='index')`
**数据操作:**
* **获取数据:** `series[index]`
* **设置数据:** `series[index] = new_value`
* **添加数据:** `series.append(new_data, ignore_index=True)`
* **删除数据:** `series.drop(index)`
### 2.3 Series的常用函数和方法
Series提供了丰富的函数和方法,用于数据处理和分析。
**常见函数:**
* **统计函数:** `mean()`, `median()`, `max()`, `min()`
* **数据转换函数:** `astype()`, `fillna()`, `replace()`
* **字符串操作函数:** `str.upper()`, `str.lower()`, `str.split()`
**常用方法:**
* **排
0
0