重点【删除行或列、去重、改类型、排序、填充、检测缺失值、删除空值、分组】
时间: 2023-11-29 16:45:36 浏览: 26
以下是对重点操作的介绍和演示:
1. 删除行或列:
使用`dropna()`函数可以删除带有缺失值的行或列。可以通过设置`axis`参数来指定删除行还是列,默认为删除行。可以通过设置`how`参数来指定删除的条件,`any`表示行或列中只要有一个缺失值就清除,`all`表示要整行或整列都是缺失值才清除。示例代码如下:
```python
import pandas as pd
import numpy as np
df = pd.DataFrame([[3,4,5], [1,6,np.nan], ['xxj',np.nan,np.nan],[np.nan,np.nan,np.nan]])
df.dropna(axis=0, how='any', inplace=True) # 删除带有缺失值的行
df.dropna(axis=1, how='all', inplace=True) # 删除整列都是缺失值的列
```
2. 去重:
使用`drop_duplicates()`函数可以去除DataFrame中的重复行。示例代码如下:
```python
df.drop_duplicates(inplace=True) # 去除重复行
```
3. 改类型:
使用`astype()`函数可以改变DataFrame中某一列的数据类型。示例代码如下:
```python
df['column_name'] = df['column_name'].astype('new_type') # 将某一列的数据类型改为new_type
```
4. 排序:
使用`sort_values()`函数可以对DataFrame按照某一列或多列进行排序。示例代码如下:
```python
df.sort_values(by='column_name', ascending=True, inplace=True) # 按照某一列升序排序
```
5. 填充:
使用`fillna()`函数可以对DataFrame中的缺失值进行填充。示例代码如下:
```python
df.fillna(value='new_value', inplace=True) # 将缺失值填充为new_value
```
6. 检测缺失值:
使用`isnull()`函数可以检测DataFrame中的缺失值,返回一个布尔型的DataFrame。示例代码如下:
```python
df.isnull() # 检测DataFrame中的缺失值
```
7. 删除空值:
使用`dropna()`函数可以删除DataFrame中的空值。示例代码如下:
```python
df.dropna(inplace=True) # 删除空值
```
8. 分组:
使用`groupby()`函数可以对DataFrame进行分组操作。示例代码如下:
```python
df.groupby('column_name') # 按照某一列进行分组
```