图像分类dataset构建
时间: 2023-08-24 12:05:59 浏览: 118
构建图像分类数据集的步骤如下:
1. 安装配置环境准备工作,包括安装Anaconda和Jupyter Notebook等工具。
2. 进行图像采集,可以选择网络爬取或者自己拍摄图像。
3. 注意事项有:删除无关图片、解决类别均衡问题(不同类别图像的数量相差不能太悬殊)、确保多样性、代表性和一致性。
4. 删除多余文件,包括删除系统自动生成的多余文件和文件夹、删除gif文件和非三通道图像。
5. 下载demo数据集,如melon17瓜果图像分类数据集和fruit81水果图像分类数据集作为待处理数据集。
6. 统计图像尺寸和比例分布。
7. 可视化拍摄地点地图。
8. 划分训练集和测试集。
9. 可视化文件夹中的图像。
10. 进行图像分类数据集探索统计并编写代码模板。
需要注意的是,如果训练集的图像分布与测试集(或真实测试场景)的图像分布不一致,可能会出现OOD(Out-Of-Distribution)问题。<span class="em">1</span><span class="em">2</span><span class="em">3</span>
#### 引用[.reference_title]
- *1* *2* *3* [(一)构建自己的图像分类数据集(datawhale学习)](https://blog.csdn.net/qq_49071848/article/details/128721278)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"]
[ .reference_list ]
阅读全文