python缺失值识别处理
时间: 2023-08-03 11:06:14 浏览: 95
在Python中,可以使用pandas库来识别和处理缺失值。下面是一些常见的缺失值处理方法:
1. 检查缺失值
```python
import pandas as pd
# 读取数据
df = pd.read_csv('data.csv')
# 检查每列中的缺失值数量
print(df.isnull().sum())
```
2. 删除缺失值
可以使用`dropna()`函数来删除包含缺失值的行或列。例如:
```python
import pandas as pd
# 读取数据
df = pd.read_csv('data.csv')
# 删除包含缺失值的行
df.dropna(inplace=True)
# 删除包含缺失值的列
df.dropna(axis=1, inplace=True)
```
3. 填充缺失值
可以使用`fillna()`函数来填充缺失值。例如,可以使用中位数、平均值或众数来填充缺失值。
```python
import pandas as pd
# 读取数据
df = pd.read_csv('data.csv')
# 使用中位数填充缺失值
median = df['column_name'].median()
df['column_name'].fillna(median, inplace=True)
# 使用平均值填充缺失值
mean = df['column_name'].mean()
df['column_name'].fillna(mean, inplace=True)
# 使用众数填充缺失值
mode = df['column_name'].mode()[0]
df['column_name'].fillna(mode, inplace=True)
```
以上是一些常见的缺失值处理方法,可以根据具体情况选择适合自己的方法。
阅读全文