pandas 随机生成缺失值
时间: 2023-10-12 22:17:10 浏览: 88
Pandas 缺失数据处理的实现
你可以使用 pandas 库的 `DataFrame` 中的 `sample` 方法来生成随机缺失值。
以下是一个示例代码:
```python
import pandas as pd
import numpy as np
# 创建一个 DataFrame
df = pd.DataFrame({'A': np.random.randint(1, 10, size=10),
'B': np.random.randint(1, 10, size=10),
'C': np.random.randint(1, 10, size=10)})
# 随机选择 3 个位置作为缺失值
missing = df.sample(n=3)
missing = list(zip(missing.index, missing.columns))
# 将这些位置的值设置为 NaN
for row, col in missing:
df.at[row, col] = np.nan
```
在这个例子中,我们首先创建了一个 DataFrame,然后使用 `sample` 方法随机选择了 3 个位置,并将它们存储为一个列表。然后我们使用 `at` 方法将这些位置的值设置为 NaN。
请注意,由于我们使用了 `at` 方法,因此我们需要指定行和列的标签。如果你想使用行和列的索引来设置值,可以使用 `iloc` 方法。
阅读全文