填充分类的空值 dataframe fillna
时间: 2024-01-09 20:05:26 浏览: 77
为了填充分类的空值,可以使用`fillna()`函数。下面是一个例子:
假设我们有一个名为`titanic`的数据框,其中有一个名为`Cabin`的列包含分类数据,我们想要填充其中的空值。我们可以使用以下代码:
```python
titanic['Cabin'].fillna('Unknown', inplace=True)
```
这将把所有的空值替换为字符串'Unknown'。如果不想在原始数据框上进行更改,可以省略`inplace=True`参数。
如果想要使用前一个非空值填充空值,可以使用`ffill`参数。如果想要使用后一个非空值填充空值,可以使用`bfill`参数。
```python
titanic['Cabin'].fillna(method='ffill', inplace=True) # 使用前一个非空值填充空值
titanic['Cabin'].fillna(method='bfill', inplace=True) # 使用后一个非空值填充空值
```
相关问题
dataframe fillna value
`fillna` 方法的 `value` 参数用于指定要填充的值。下面是 `fillna` 方法的示例代码:
```python
import pandas as pd
import numpy as np
# 创建包含空值的 DataFrame
df = pd.DataFrame({'A': [1, 2, np.nan, 4],
'B': [5, np.nan, 7, 8],
'C': [9, 10, 11, np.nan]})
# 使用 -1 填充空值
df.fillna(value=-1)
# 输出结果
A B C
0 1.0 5.0 9.0
1 2.0 -1.0 10.0
2 -1.0 7.0 11.0
3 4.0 8.0 -1.0
```
在这个示例中,我们使用 `fillna` 方法将 DataFrame 中的空值填充为 -1。可以看到,原来包含空值的 DataFrame 现在已经被填充为了一个完整的 DataFrame,其中所有的空值都被填充为了 -1。
python dataframe fillna
在Python的pandas库中,`fillna()`函数用于填充DataFrame中的缺失值(NaN)。这个函数非常有用,因为它允许你用几种策略替换缺失值,如指定特定的值、使用前一项的值、使用后一项的值,或者使用整个列或行的平均值、中位数等统计信息。
基本语法如下:
```python
df.fillna(value, inplace=False, method=None, limit=None)
```
- `value`: 可以是一个常数值,也可以是另一个Series,用来替换缺失值。
- `inplace` (默认为False): 如果设置为True,会直接修改原数据框,如果不设置或设置为False,则返回一个新的填充后的DataFrame。
- `method`: 可选,可以是'backfill', 'bfill' (回溯填充), 'pad' 或 'ffill' (向前填充)。
- `limit`: 可选,如果指定了方法为'ffill'或'bfill',它表示只填充前或后续多少个空值。
例如:
```python
# 填充所有 NaN 为0
df.fillna(0)
# 使用前一个非缺失值填充
df.fillna(method='ffill')
# 使用后一个非缺失值填充
df.fillna(method='bfill')
```
阅读全文