from sklearn.datasets import load_wine wine = load_wine() print(wine.target)怎么只输出两类
时间: 2024-02-01 11:02:56 浏览: 202
sklearn机器学习-酒数据集
对于这个问题,可能需要我们仔细查看数据集信息。Wine数据集包含13个特征,3个类别,每个类别有59,71,48个样本。因此,可以通过对每个类别进行随机采样来使每个类别具有相同数量的样本。可以使用如下代码:
```
import numpy as np
from sklearn.datasets import load_wine
wine = load_wine()
class_0 = np.where(wine.target == 0)[0]
class_1 = np.where(wine.target == 1)[0]
class_2 = np.where(wine.target == 2)[0]
class_0_sampled = np.random.choice(class_0, size=48, replace=False)
class_1_sampled = np.random.choice(class_1, size=48, replace=False)
new_target = np.concatenate([class_0_sampled, class_1_sampled, class_2])
print(wine.target[new_target])
```
这样,我们就可以得到新的target,其中前两个类别的样本数量相同。注意,由于class_2本来就只有48个样本,所以target中类别仍然有三个,数量分别为48,48,48。
阅读全文