导入数据对数据进行缺失值和异常值处理,均是分类数据python代码
时间: 2023-07-14 22:13:47 浏览: 105
缺失值处理:
1. 删除缺失值:
```python
df.dropna(inplace=True)
```
2. 用均值、中位数或众数填充缺失值:
```python
# 用均值填充
df.fillna(df.mean(), inplace=True)
# 用中位数填充
df.fillna(df.median(), inplace=True)
# 用众数填充
df.fillna(df.mode().iloc[0], inplace=True)
```
异常值处理:
1. 通过箱线图识别异常值:
```python
import seaborn as sns
sns.boxplot(data=df)
```
2. 通过z-score识别异常值:
```python
from scipy import stats
z_scores = stats.zscore(df)
abs_z_scores = np.abs(z_scores)
filtered_entries = (abs_z_scores < 3).all(axis=1)
new_df = df[filtered_entries]
```
阅读全文