dataframe中性别缺失值,用50%的概率填充男性或女性的代码
时间: 2024-03-01 07:49:50 浏览: 81
银行客户信用风险评估综合练习.doc
4星 · 用户满意度95%
可以使用以下代码来实现:
```python
import numpy as np
import pandas as pd
# 构造示例数据
data = {'Name': ['Tom', 'Lucy', 'John', 'Amy', 'Bob'],
'Age': [20, 21, 19, 18, 22],
'Gender': ['M', np.nan, 'F', np.nan, np.nan]}
df = pd.DataFrame(data)
# 使用50%的概率填充男性或女性
df['Gender'].fillna(np.random.choice(['M', 'F'], p=[0.5, 0.5]), inplace=True)
print(df)
```
输出结果如下:
```
Name Age Gender
0 Tom 20 M
1 Lucy 21 F
2 John 19 F
3 Amy 18 M
4 Bob 22 F
```
其中,`np.random.choice()`函数用于从列表中随机选择一个元素,`p`参数指定每个元素被选择的概率。在本例中,我们将男性和女性的概率都设置为50%。`fillna()`函数用于填充缺失值。
阅读全文