pandas的用法3000字
时间: 2023-11-25 08:52:38 浏览: 85
Pandas是一个基于NumPy的Python数据分析库,它提供了一种高效的DataFrame数据结构,用于快速处理大量数据。下面是Pandas的一些常用用法:
1.导入Pandas库
```python
import pandas as pd
```
2.创建DataFrame
```python
# 从列表创建DataFrame
data = [['Alex',10],['Bob',12],['Clarke',13]]
df = pd.DataFrame(data,columns=['Name','Age'])
print(df)
# 从字典创建DataFrame
data = {'Name':['Tom', 'Jack', 'Steve', 'Ricky'],'Age':[28,34,29,42]}
df = pd.DataFrame(data)
print(df)
```
3.读取数据
```python
# 读取csv文件
df = pd.read_csv('file.csv')
# 读取excel文件
df = pd.read_excel('file.xlsx')
```
4.数据清洗
```python
# 删除空值
df.dropna()
# 替换空值
df.fillna(value)
# 删除重复值
df.drop_duplicates()
```
5.数据选择
```python
# 选择某一列
df['Name']
# 选择多列
df[['Name', 'Age']]
# 选择某一行
df.loc[0]
# 选择多行
df.loc[0:2]
# 选择满足条件的行
df[df['Age'] > 30]
```
6.数据排序
```python
# 按某一列升序排序
df.sort_values('Age')
# 按某一列降序排序
df.sort_values('Age', ascending=False)
```
7.数据分组
```python
# 按某一列分组
df.groupby('Name').mean()
# 按多列分组
df.groupby(['Name', 'Age']).mean()
```
8.数据合并
```python
# 合并两个DataFrame
pd.merge(df1, df2, on='key')
# 按列合并
pd.concat([df1, df2], axis=1)
```
9.数据统计
```python
# 计算平均值
df.mean()
# 计算标准差
df.std()
# 计算最大值
df.max()
# 计算最小值
df.min()
```
阅读全文