花瓣长度,宽度聚类分析代码
时间: 2024-11-21 13:27:24 浏览: 12
花瓣长度和宽度通常是在植物学领域中用于描述花的形态特征的数据,而在统计学和机器学习中,这类数据常常用于做花卉样本的聚类分析,以便识别不同的种类或群体。在Python中,我们可以使用scikit-learn库来进行这个任务,下面是一个简单的例子:
```python
import pandas as pd
from sklearn.datasets import load_iris
from sklearn.preprocessing import StandardScaler
from sklearn.cluster import KMeans
# 加载鸢尾花数据集
iris = load_iris()
X = iris.data[:, 2:] # 取出花瓣长度和宽度作为特征
y = iris.target # 获取标签
# 数据预处理(标准化)
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)
# 使用K-means进行聚类,这里假设我们想要分成3类(鸢尾花有三种)
kmeans = KMeans(n_clusters=3)
kmeans.fit(X_scaled)
# 获取每个样本的聚类结果
labels = kmeans.labels_
# 结果可视化(例如使用matplotlib)
plt.scatter(X_scaled[:, 0], X_scaled[:, 1], c=labels, cmap='viridis')
plt.xlabel('Petal Length')
plt.ylabel('Petal Width')
plt.title('Iris Dataset Clustering by Petal Length and Width')
plt.show()
阅读全文