df怎么删除某一列,用中位数填充空白值,删除重复值,删掉异常值
时间: 2023-10-21 21:03:31 浏览: 114
删除数组内重复的数据
删除某一列可以使用 `drop()` 方法,例如删除名为 `column_name` 的列:
``` python
df = df.drop('column_name', axis=1)
```
使用中位数填充空白值可以使用 `fillna()` 方法,例如:
``` python
median = df['column_name'].median()
df['column_name'].fillna(median, inplace=True)
```
删除重复值可以使用 `drop_duplicates()` 方法,例如:
``` python
df = df.drop_duplicates()
```
删掉异常值可以使用条件判断语句,例如删除名为 `column_name` 的列中大于 3 倍标准差的值:
``` python
mean = df['column_name'].mean()
std = df['column_name'].std()
df = df[df['column_name'] < (mean + 3 * std)]
```
阅读全文