数据集随机抽样 python代码
时间: 2023-08-09 18:01:54 浏览: 234
python Pandas如何对数据集随机抽样
在Python中,我们可以利用NumPy库的random模块来实现数据集的随机抽样。下面是一个示例代码:
```python
import numpy as np
# 生成一个包含100个随机整数的数据集
dataset = np.random.randint(0, 100, size=100)
# 使用random模块的choice函数进行随机抽样,抽样数量为20
sample = np.random.choice(dataset, size=20)
# 打印抽样结果
print("随机抽样结果:")
print(sample)
```
在上述代码中,首先我们使用`np.random.randint`函数生成一个包含100个随机整数的数据集。接着,我们使用`np.random.choice`函数进行随机抽样,其中`dataset`为原始数据集,`size`指定了抽样的数量,此处为20。最后,我们打印出抽样结果。
需要注意的是,随机抽样可能会导致抽样结果的重复,因此若需要避免重复抽样,可以使用`replace=False`参数来设置为非放回抽样。
希望以上代码对你有所帮助!
阅读全文