可以用于语义分割的公开文本数据集有哪些
时间: 2023-12-25 12:17:58 浏览: 160
以下是一些常用的可用于语义分割的公开文本数据集:
1. Pascal VOC:该数据集包含20个对象类别的图像,主要用于对象检测和语义分割。
2. COCO:该数据集包含超过33万张图像,涵盖80个对象类别,主要用于对象检测、分割和关键点检测。
3. Cityscapes:该数据集包含来自大约50个城市的5000张高分辨率图像,用于道路场景分析,包括车辆、行人和建筑。
4. ADE20K:该数据集包含来自Scene Parsing Challenge的20210张图像,涵盖150个类别,包括天空、草地、建筑、人、动物等。
5. ImageNet:该数据集包含来自1000个类别的超过1400万张图像,主要用于图像分类和对象检测。
6. Labeled Faces in the Wild:该数据集包含超过13000张人脸图像,主要用于人脸识别和属性分类。
以上数据集在语义分割领域都有广泛应用,并且都是公开可用的。
相关问题
文字语义分割数据集有哪些
以下是一些常用的文字语义分割数据集:
1. COCO-Text: 该数据集包含超过63,000个文本实例,分布在近20,000张图像中。每个文本实例都有其对应的位置和标签。
2. ICDAR: ICDAR(International Conference on Document Analysis and Recognition)是一个专门用于文档分析和识别的国际会议。其数据集包含多种类型的文本,包括手写和印刷体。
3. SynthText: SynthText是一个基于合成的数据集,其中包含了一些具有挑战性的场景,如弯曲的文本和遮挡的文本等。
4. Total-Text: Total-Text数据集包含13,000个文本实例,分布在1255张图像中。它包含各种类型的文本,如水平,竖直和曲线文本等。
5. MSRA-TD500: MSRA-TD500是一个针对场景文本检测和识别的数据集。它包含500张图像,其中包含了多种类型的文本。
6. Street View Text: Street View Text是一个专门用于街景文本检测和识别的数据集,其中包含数百万个文本实例,分布在数百万张图像中。
这些数据集都是公开可用的,可以帮助研究人员和开发者训练和测试自己的文字语义分割模型。
阅读全文