python 分层抽样
时间: 2023-10-18 08:30:44 浏览: 129
python实现的分层随机抽样案例
Python中的分层抽样是指从总体中根据不同层级进行抽样的过程。通常,数据被分成不同的层级,然后从每个层级中获取样本。下面是一个示例代码,展示了如何在Python中进行分层抽样:
```python
import pandas as pd
from sklearn.model_selection import train_test_split
# 假设有一个包含标签的数据集
data = pd.read_csv("data.csv")
# 根据标签分成不同的层级
strata = data.groupby('label')
# 分层抽样,从每个层级中抽取样本
sampled_data = strata.apply(lambda x: x.sample(frac=0.2, replace=False))
# 打印抽样后的数据
print(sampled_data)
```
在这个例子中,我们首先读取一个包含标签的数据集,并将其按照标签分成不同的层级。然后,使用`apply`函数从每个层级中抽取指定比例(这里是20%)的样本。最后,将抽样后的数据打印出来。
这是一个简单的分层抽样示例,你可以根据自己的数据和需求进行适当的调整和修改。
阅读全文