你生成一个数据集并给出代码演示
时间: 2024-02-22 14:00:57 浏览: 118
好的,我可以给你一个简单的生成数据集的例子,并附上Python代码演示。这个例子是生成一个二维的分类问题数据集,你可以根据实际需求修改参数和数据集类型。
```python
import numpy as np
import matplotlib.pyplot as plt
# 生成二维的分类问题数据集
def generate_dataset(n_samples, noise=0.1):
# 生成正例样本
x1 = np.random.normal(loc=2.0, scale=1.0, size=(n_samples // 2, 2))
y1 = np.ones((n_samples // 2, 1))
# 生成负例样本
x2 = np.random.normal(loc=-2.0, scale=1.0, size=(n_samples // 2, 2))
y2 = np.zeros((n_samples // 2, 1))
# 合并样本
X = np.vstack((x1, x2))
y = np.vstack((y1, y2))
# 加入噪声
X += np.random.normal(scale=noise, size=X.shape)
return X, y
# 生成数据集
X, y = generate_dataset(n_samples=1000)
# 绘制数据集
plt.scatter(X[:, 0], X[:, 1], c=y.ravel(), cmap=plt.cm.Spectral)
plt.show()
```
这段代码生成了一个包含1000个样本的二维分类问题数据集,并通过`plt.scatter()`函数进行可视化。其中,正例样本呈现为红色,负例样本呈现为蓝色。你可以根据需要调整`generate_dataset()`函数中的参数来生成不同类型的数据集。
阅读全文