pandas库怎么用
时间: 2023-11-25 18:52:17 浏览: 76
pandas的使用方法
Pandas是一个开源的数据分析和数据处理库,它提供了高效的数据结构和数据分析工具。下面是Pandas库的一些基本用法:
1.导入Pandas库
```python
import pandas as pd
```
2.创建Series数据结构
```python
# 创建一个Series
s = pd.Series([1, 3, 5, np.nan, 6, 8])
print(s)
```
3.创建DataFrame数据结构
```python
# 创建一个DataFrame
df = pd.DataFrame({'A': 1.,
'B': pd.Timestamp('20130102'), 'C': pd.Series(1, index=list(range(4)), dtype='float32'),
'D': np.array([3] * 4, dtype='int32'),
'E': pd.Categorical(["test", "train", "test", "train"]),
'F': 'foo'})
print(df)
```
4.数据的查看
```python
# 查看DataFrame的前5行
print(df.head())
# 查看DataFrame的后5行
print(df.tail())
# 查看DataFrame的索引
print(df.index)
# 查看DataFrame的列名
print(df.columns)
# 查看DataFrame的数据类型
print(df.dtypes)
# 查看DataFrame的数据统计信息
print(df.describe())
```
5.数据的选择
```python
# 选择DataFrame的某一列
print(df['A'])
# 选择DataFrame的某几行
print(df[0:3])
# 通过标签选择DataFrame的某一行
print(df.loc[dates[0]])
# 通过标签选择DataFrame的某一列
print(df.loc[:, ['A', 'B']])
# 通过标签选择DataFrame的某几行和某几列
print(df.loc['20130102':'20130104', ['A', 'B']])
# 通过位置选择DataFrame的某一行
print(df.iloc[3])
# 通过位置选择DataFrame的某几行和某几列
print(df.iloc[3:5, 0:2])
# 通过布尔值选择DataFrame的某几行
print(df[df.A > 0])
```
6.数据的修改
```python
# 修改DataFrame的某一列
df['F'] = np.nan
print(df)
# 添加一列数据
df['G'] = pd.Series([1, 2, 3, 4, 5, 6], index=pd.date_range('20130102', periods=6))
print(df)
# 删除一列数据
df = df.drop('G', axis=1)
print(df)
```
阅读全文