mnist数据集二值化后的特征向量提取代码
时间: 2023-10-05 08:06:41 浏览: 121
MNIST手写数字数据集(原始数据+解析后7000张图片)
这里提供一个Python代码示例,用于将MNIST数据集二值化并提取特征向量:
```python
import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import fetch_openml
from sklearn.preprocessing import binarize
from sklearn.decomposition import PCA
# 加载MNIST数据集
mnist = fetch_openml('mnist_784')
# 将特征矩阵二值化
X_binarized = binarize(mnist.data.astype(np.float32), threshold=0.5)
# 对二值化后的数据进行主成分分析(PCA)降维
pca = PCA(n_components=50)
X_pca = pca.fit_transform(X_binarized)
# 可视化二值化后的第一张图片
plt.imshow(X_binarized[0].reshape(28, 28), cmap='gray')
plt.show()
# 打印降维后的特征向量形状
print("PCA降维后的特征向量形状:", X_pca.shape)
```
这个代码示例使用了`sklearn`库中的`fetch_openml()`函数加载MNIST数据集,然后使用`binarize()`函数将特征矩阵二值化。接下来,使用`PCA()`函数进行主成分分析,将数据降维至50维。最后,打印出降维后的特征向量形状。
阅读全文