fetch_lfw_people
时间: 2024-12-04 18:14:57 浏览: 26
`fetch_lfw_people` 是一个用于加载和预处理Labeled Faces in the Wild (LFW) 数据集的工具函数。这个函数通常用于机器学习和计算机视觉任务中,特别是人脸识别和人脸验证的研究。
以下是 `fetch_lfw_people` 的主要特点和用法:
1. **数据加载**:从网上下载LFW数据集(如果尚未下载),并将其加载到内存中。
2. **数据预处理**:提供多种预处理选项,如调整图像大小、裁剪图像等。
3. **标签提取**:提取每个图像的标签信息,以便于后续的分类任务。
以下是一个使用 `fetch_lfw_people` 的示例代码:
```python
from sklearn.datasets import fetch_lfw_people
import matplotlib.pyplot as plt
# 加载LFW数据集
lfw_people = fetch_lfw_people(min_faces_per_person=70, resize=0.4)
# 打印数据集的基本信息
print(f"数据集大小: {lfw_people.images.shape}")
print(f"特征数量: {lfw_people.data.shape[1]}")
print(f"类别数量: {len(lfw_people.target_names)}")
# 显示第一张图像
plt.imshow(lfw_people.images[0], cmap='gray')
plt.title(lfw_people.target_names[lfw_people.target[0]])
plt.show()
```
在这个示例中,我们首先导入了必要的库,然后使用 `fetch_lfw_people` 函数加载LFW数据集。我们设置了 `min_faces_per_person=70`,这意味着只加载那些至少有70张图像的人的数据。我们还设置了 `resize=0.4`,这会将图像的大小调整为原始大小的40%。
阅读全文