ISIC-CLI数据集下载
时间: 2023-05-31 20:03:08 浏览: 199
很抱歉,作为一个AI语言模型,我无法提供ISIC-CLI数据集下载。ISIC-CLI数据集是由国际皮肤图像协会(International Skin Imaging Collaboration)提供的一个公共数据集,包含了超过23,000张皮肤图像和相关的元数据,用于皮肤病诊断和研究。如果你需要下载ISIC-CLI数据集,可以前往官方网站 https://www.isic-archive.com/ 进行下载或联系相关机构或研究人员获取。
相关问题
ISIC-2019数据集介绍,包括数据集大小、图片大小、类别数、训练集、验证集、测试集图片数量
ISIC-2019是一个用于皮肤病诊断的数据集,包含了超过25,000张镜下图像,涵盖了8种不同类型的皮肤病。数据集大小约为13GB,图片大小不一,最大的图片尺寸为6000x4500像素,最小的图片尺寸为256x256像素。数据集共分为训练集、验证集和测试集三部分,训练集包含了25,331张图片,验证集包含了1,000张图片,测试集包含了1,379张图片。其中,每个类别的训练集和验证集的图片数量不同,具体如下:
1. Melanoma(黑色素瘤):训练集8,114张,验证集1,000张
2. Nevus(痣):训练集9,524张,验证集1,000张
3. Seborrheic Keratosis(皮脂腺角化病):训练集2,142张,验证集1,000张
4. Basal Cell Carcinoma(基底细胞癌):训练集3,234张,验证集1,000张
5. Actinic Keratosis / Bowen’s Disease(日光性角化病/ Bowen病):训练集2,480张,验证集1,000张
6. Dermatofibroma(皮肤纤维瘤):训练集1,150张,验证集1,000张
7. Vascular Lesions(血管病变):训练集1,000张,验证集1,000张
8. BCC-like(类基底细胞癌):训练集986张,验证集1,000张
详细解释每一句代码import numpy as np import cv2 import os root = 'data/' # change to your data folder path data_f = ['ISIC-2017_Training_Data/', 'ISIC-2017_Validation_Data/', 'ISIC-2017_Test_v2_Data/'] mask_f = ['ISIC-2017_Training_Part1_GroundTruth/', 'ISIC-2017_Validation_Part1_GroundTruth/', 'ISIC-2017_Test_v2_Part1_GroundTruth/'] set_size = [2000, 150, 600] save_name = ['train', 'val', 'test'] height = 192 width = 256 for j in range(3): print('processing ' + data_f[j] + '......') count = 0 length = set_size[j] imgs = np.uint8(np.zeros([length, height, width, 3])) masks = np.uint8(np.zeros([length, height, width])) path = root + data_f[j] mask_p = root + mask_f[j] for i in os.listdir(path): if len(i.split('_'))==2: img = cv2.imread(path+i) img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB) img = cv2.resize(img, (width, height)) m_path = mask_p + i.replace('.jpg', '_segmentation.png') mask = cv2.imread(m_path, 0) mask = cv2.resize(mask, (width, height)) imgs[count] = img masks[count] = mask count +=1 print(count) np.save('{}/data_{}.npy'.format(root, save_name[j]), imgs) np.save('{}/mask_{}.npy'.format(root, save_name[j]), masks)
这段代码是一个数据处理的脚本,目的是将一个包含有图像和掩膜的数据集处理成模型可以理解的训练数据和验证数据。下面是每一行的功能:
1. `import numpy as np`:导入 NumPy 库,用于处理多维数组和矩阵运算。
2. `import cv2`:导入 OpenCV 库,用于图像处理和计算机视觉应用。
3. `import os`:导入 os 库,用于访问操作系统的功能。
4. `root = 'data/'`:设置数据集所在的文件夹路径。
5. `data_f = ['ISIC-2017_Training_Data/', 'ISIC-2017_Validation_Data/', 'ISIC-2017_Test_v2_Data/']`:设置包含图像的文件夹名称。
6. `mask_f = ['ISIC-2017_Training_Part1_GroundTruth/', 'ISIC-2017_Validation_Part1_GroundTruth/', 'ISIC-2017_Test_v2_Part1_GroundTruth/']`:设置包含掩膜的文件夹名称。
7. `set_size = [2000, 150, 600]`:设置每个数据集的大小。
8. `save_name = ['train', 'val', 'test']`:设置每个数据集的名称。
9. `height = 192`:设置图像的高度。
10. `width = 256`:设置图像的宽度。
11. `for j in range(3):`:循环处理每个数据集。
12. `print('processing ' + data_f[j] + '......')`:输出正在处理的数据集名称。
13. `count = 0`:设置计数器为0。
14. `length = set_size[j]`:获取当前数据集的长度。
15. `imgs = np.uint8(np.zeros([length, height, width, 3]))`:创建一个空的多维数组来保存图像数据。它是一个四维的数组,第一个维度表示样本数量,第二个和第三个维度表示图像的高度和宽度,最后一个维度表示通道数。
16. `masks = np.uint8(np.zeros([length, height, width]))`:创建一个空的多维数组来保存掩膜数据。它是一个三维的数组,第一个维度表示样本数量,第二个和第三个维度表示掩膜的高度和宽度。
17. `path = root + data_f[j]`:获取当前数据集所在的路径。
18. `mask_p = root + mask_f[j]`:获取当前掩膜所在的路径。
19. `for i in os.listdir(path):`:循环处理当前数据集下的每个图像。
20. `if len(i.split('_'))==2:`:判断当前图像是否包含掩膜。如果包含,继续处理;否则跳过。
21. `img = cv2.imread(path+i)`:读取当前图像的数据。
22. `img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)`:将读取的数据从 BGR 格式转换为 RGB 格式。
23. `img = cv2.resize(img, (width, height))`:将图像缩放到指定的大小。
24. `m_path = mask_p + i.replace('.jpg', '_segmentation.png')`:获取当前图像对应的掩膜路径。
25. `mask = cv2.imread(m_path, 0)`:读取当前掩膜的数据。
26. `mask = cv2.resize(mask, (width, height))`:将掩膜缩放到指定的大小。
27. `imgs[count] = img`:将当前图像保存到图像数组中。
28. `masks[count] = mask`:将当前掩膜保存到掩膜数组中。
29. `count +=1`:计数器加1。
30. `print(count)`:输出当前处理的图像数量。
31. `np.save('{}/data_{}.npy'.format(root, save_name[j]), imgs)`:将处理后的图像数据保存为 NPY 格式。
32. `np.save('{}/mask_{}.npy'.format(root, save_name[j]), masks)`:将处理后的掩膜数据保存为 NPY 格式。
阅读全文