如何利用python在一个已经生成的dataframe中的前4列随机产生20个nan
时间: 2024-05-03 15:21:34 浏览: 73
python dataframe NaN处理方式
5星 · 资源好评率100%
可以使用numpy的random.choice()函数生成随机的行和列索引,然后将对应的单元格赋值为NaN。
具体代码如下:
```python
import numpy as np
import pandas as pd
# 生成一个5行4列的示例dataframe
df = pd.DataFrame(np.random.randn(5, 4), columns=list('ABCD'))
# 随机生成20个需要赋值为NaN的单元格的行和列索引
rows = np.random.choice(df.index, size=20)
cols = np.random.choice(df.columns[:4], size=20)
# 将对应的单元格赋值为NaN
df.loc[rows, cols] = np.nan
```
这样就在原有的dataframe中随机生成了20个NaN值。
阅读全文