pandas库使用教程
时间: 2023-11-09 07:02:14 浏览: 153
pandas是Python中一个非常常用的数据处理库,它提供了高效的数据结构和数据分析工具,下面是pandas库的使用教程:
1. 导入pandas库
```python
import pandas as pd
```
2. 创建Series
Series是pandas中最基本的数据结构,类似于一维数组,可以通过列表、数组等创建。
```python
s = pd.Series([1, 3, 5, np.nan, 6, 8])
print(s)
```
输出结果:
```
0 1.0
1 3.0
2 5.0
3 NaN
4 6.0
5 8.0
dtype: float64
```
3. 创建DataFrame
DataFrame是pandas中最常用的数据结构,类似于二维表格,可以通过字典、列表等创建。
```python
data = {'name': ['Tom', 'Jerry', 'Mike', 'Rose'], 'age': [20, 21, 22, 23]}
df = pd.DataFrame(data)
print(df)
```
输出结果:
```
name age
0 Tom 20
1 Jerry 21
2 Mike 22
3 Rose 23
```
4. 数据读取和写入
pandas可以读取和写入多种格式的数据,如csv、excel、json等。
```python
# 读取csv文件
df = pd.read_csv('data.csv')
# 写入csv文件
df.to_csv('data.csv', index=False)
```
5. 数据选择和过滤
可以使用loc和iloc方法进行数据选择和过滤。
```python
# 选择第一行数据
df.loc[0]
# 选择第一列数据
df['name']
# 过滤年龄大于等于22的数据
df[df['age'] >= 22]
```
6. 数据统计和计算
pandas提供了丰富的数据统计和计算方法,如mean、sum、count等。
```python
# 计算年龄平均值
df['age'].mean()
# 计算每列数据的和
df.sum()
```
阅读全文