线性不可分数据集可视化代码
时间: 2024-10-17 18:04:49 浏览: 29
Python数据分析、挖掘与可视化(慕课版).rar
5星 · 资源好评率100%
线性不可分数据集通常是指通过一条直线或超平面无法完美区分的数据点,它们在二维或更高维度空间中分布是非线性的,难以直观地划分。在机器学习中,处理这类数据集时,我们可能需要使用更复杂的模型,如核函数支持向量机(SVM)或神经网络。
以下是一个简单的Python代码片段,使用matplotlib库来可视化线性不可分的数据集,例如著名的鸢尾花数据集中的两个类别:
```python
import numpy as np
import matplotlib.pyplot as plt
from sklearn import datasets
# 加载鸢尾花数据集(已经预处理过)
iris = datasets.load_iris()
X, y = iris.data[:, :2], iris.target
# 创建两个类别
setosa = X[y == 0]
versicolor = X[y == 1]
# 绘制随机选择的点
plt.scatter(setosa[:, 0], setosa[:, 1], color='red', label='Setosa')
plt.scatter(versicolor[:, 0], versicolor[:, 1], color='blue', label='Versicolor')
# 添加标题和标签
plt.title('Linearly inseparable data visualization using Iris dataset')
plt.xlabel('Feature 1')
plt.ylabel('Feature 2')
plt.legend()
# 显示图形
plt.show()
```
在这个例子中,虽然两者的边界在原始坐标系下看起来可能是线性不可分的,但我们并没有试图找到最佳分类边界的线,而是展示了数据本身的分布情况。
阅读全文