如何用代码将数据集中缺失的部分用众数补齐
时间: 2024-03-03 15:49:15 浏览: 21
假设数据集存储在一个名为 `data` 的 Pandas DataFrame 中,可以按照以下步骤用代码将数据集中缺失的部分用众数补齐:
1. 导入必要的库:
```python
import pandas as pd
from collections import Counter
```
2. 计算每列的众数:
```python
mode = data.mode().iloc[0]
```
3. 使用众数替换缺失值:
```python
data = data.fillna(mode)
```
完整代码如下:
```python
import pandas as pd
from collections import Counter
data = pd.DataFrame({'A': [1, 2, 3, None, None],
'B': [None, 2, None, 3, None],
'C': [1, 2, None, 3, None]})
mode = data.mode().iloc[0]
data = data.fillna(mode)
print(data)
```
输出结果为:
```
A B C
0 1.0 2.0 1.0
1 2.0 2.0 2.0
2 3.0 2.0 2.0
3 2.0 3.0 3.0
4 2.0 2.0 2.0
```
上述代码中,我们先计算了每列的众数,然后使用 `fillna()` 方法将缺失值替换为对应列的众数。