8类半导体晶圆缺陷图像分类数据集

版权申诉
5星 · 超过95%的资源 2 下载量 41 浏览量 更新于2024-11-14 2 收藏 41.67MB ZIP 举报
资源摘要信息:"半导体晶圆缺陷图谱分类数据集25519张8类别.zip" 半导体晶圆生产过程中,晶圆表面的缺陷检测是保证产品质量的重要环节。晶圆缺陷的类型繁多,包括但不限于中心缺陷(center)、环形缺陷(donut)、边缘定位缺陷(edge-loc)、边缘环形缺陷(edge-ring)、定位缺陷(loc)、近满缺陷(near-full)、随机缺陷(random)、划痕缺陷(scratch)等。这些缺陷会直接影响半导体器件的性能和可靠性。因此,为了提高检测的准确性和效率,通常会使用机器学习或者深度学习的方法对晶圆表面缺陷进行自动分类。 本资源提供了一个专门针对半导体晶圆缺陷分类的图像数据集,包含25519张不同缺陷的jpg图片。数据集被准确且合理地分类存放在八个不同的文件夹中,分别对应八种不同的缺陷类型。每个文件夹下存放的是与该类别相对应的图片文件。具体分类及图片数量如下: 1. center(中心缺陷):共有4294张图片。 2. donut(环形缺陷):共有555张图片。 3. edge-loc(边缘定位缺陷):共有5189张图片。 4. edge-ring(边缘环形缺陷):共有9680张图片。 5. loc(定位缺陷):共有3593张图片。 6. near-full(近满缺陷):共有149张图片。 7. random(随机缺陷):共有866张图片。 8. scratch(划痕缺陷):共有1193张图片。 数据集格式仅包含jpg图片,说明数据集用于图像分类任务,而不是用于目标检测任务。因为目标检测任务需要对图片中的对象进行定位,而该数据集没有标注文件,即没有提供关于缺陷位置的信息。 数据集的使用应注意以下几点: 1. 本数据集不提供关于训练模型或权重文件精度的保证,数据集提供的是准确且合理分类存放的图像,不包含任何标注信息。 2. 在使用该数据集进行机器学习或深度学习模型训练之前,研究者或工程师需要对图像进行进一步处理,例如图像预处理、数据增强、标注等,以便更好地训练分类器。 3. 数据集中的图片数量不均匀,如edge-ring类别图片数量最多,而near-full类别图片数量最少。在训练过程中,可能需要对数量较少的类别进行过采样,以平衡各个类别的数据量,防止模型训练过程中出现偏差。 该数据集对于半导体晶圆制造业的研究者和工程师而言是一个非常宝贵的资源。通过使用这个数据集,可以训练出能够准确分类晶圆表面缺陷的模型,这对于提高晶圆质量控制、减少生产成本和提升产品良率具有重要的意义。同时,随着深度学习技术的不断进步,基于此类数据集开发出的模型也能在实际生产环境中实现高度自动化和高精度的缺陷检测。