可以看到,类标共分为三类,前面50个类标位0,中间50个类标位1,后面为2。下面讲解
另一种导入鸢尾花数据集的方法,这里是从某一网页导入数据,但是如果网页打不开很可
输出如图所示,鸢尾花(iris)是数据挖掘常用到的一个数据集,包含150种鸢尾花的信息,
每50种取自三个鸢尾花种之一(setosa,versicolour或virginica)。每个花的特征用下面的
5 种 属 性 描 述 萼 片 长 度 (Sepal.Length) 、 萼 片 宽 度 (Sepal.Width) 、 花 瓣 长 度
(Petal.Length)、花瓣宽度(Petal.Width)、类(Species)。
可以看到如下结果,分别表示4个属性的样本值、均值、标准误、最小值、25%分位数、
中位数、75%分位数、最大值。接下来主介绍可视化操作,调用Pandas扩展包读取数据并
"https://archive.ics.uci.edu/ml/machine-learning-databases
dataset = pandas.read_csv(url, names=names)
print(dataset.describe())
第4页 共17页