python pandas库调用
时间: 2023-12-08 22:05:39 浏览: 88
pandas是一个开源的数据分析和数据处理库,它提供了大量的数据处理函数和数据结构,可以方便地进行数据清洗、数据转换、数据分析等操作。下面是一些常见的pandas库调用方法:
1.导入pandas库
```python
import pandas as pd
```
2.创建Series数据结构
```python
# 创建一个Series对象
s = pd.Series([1, 3, 5, np.nan, 6, 8])
print(s)
```
3.创建DataFrame数据结构
```python
# 创建一个DataFrame对象
df = pd.DataFrame({'A': 1.,
'B': pd.Timestamp('20130102'),
'C': pd.Series(1, index=list(range(4)), dtype='float32'),
'D': np.array([3] * 4, dtype='int32'),
'E': pd.Categorical(["test", "train", "test", "train"]),
'F': 'foo'})
print(df)
```
4.读取和写入数据
```python
# 读取csv文件
df = pd.read_csv('data.csv')
# 写入csv文件
df.to_csv('data.csv')
```
5.数据清洗和转换
```python
# 删除缺失值
df.dropna()
# 填充缺失值
df.fillna(value=0)
# 替换值
df.replace(1, 'one')
# 数据转换
df.astype(float)
```
6.数据分析
```python
# 描述性统计
df.describe()
# 分组统计
df.groupby('A').sum()
# 数据透视表
pd.pivot_table(df, values='D', index=['A', 'B'], columns=['C'])
```
阅读全文