pandas 的pandas的用法
时间: 2024-07-16 12:01:27 浏览: 68
Pandas是一个强大的数据处理库,它允许用户轻松地对结构化数据进行清洗、操作和分析。它的核心有两个重要的数据结构:Series(一维带标签数组)和DataFrame(二维表格型数据结构,类似于电子表格)。以下是Pandas的一些基本用法:
1. **导入模块**:首先需要通过`import pandas as pd`语句导入pandas模块。
```python
import pandas as pd
```
2. **创建Series**:可以使用字典或者列表创建Series。
```python
data = {'Name': ['Tom', 'Nick', 'John'], 'Age': [20, 21, 19]}
s = pd.Series(data)
```
3. **创建DataFrame**:可以用字典、列表的列表,或者其他pandas数据结构初始化。
```python
df = pd.DataFrame(data)
```
4. **读取文件**:支持多种数据源,如CSV、Excel、SQL等。
```python
df = pd.read_csv('file.csv')
```
5. **数据清洗**:提供大量函数用于处理缺失值、重复值和异常值。
```python
df.dropna() # 删除含有缺失值的行
df.fillna(value) # 填充缺失值
```
6. **数据筛选和分组**:
```python
df[df['Age'] > 20] # 筛选年龄大于20的记录
grouped = df.groupby('Name') # 按名字分组
```
7. **数据分析和统计**:如计算描述性统计、聚合等。
```python
df.describe() # 计算统计摘要
df['Age'].mean() # 年龄的平均值
```
阅读全文