室内场景3d目标检测的多模态数据集有哪些,分别大约多大内存
时间: 2024-04-02 19:34:05 浏览: 15
以下是一些室内场景的3D多模态目标检测数据集:
1. SUN RGB-D: 这是一个室内场景的RGB-D数据集,包含10,335个场景和45个物体类别。数据集大小约为42GB。
2. ScanNet: 这也是一个室内场景的RGB-D数据集,包含1513个场景和18个物体类别。数据集大小约为1.2TB。
3. NYU Depth V2: 这是一个RGB-D数据集,包含1449个场景和894个物体类别。数据集大小约为534GB。
4. 3D object detection benchmark: 这是一个基于KITTI数据集的3D目标检测评估基准,包括室内和室外场景的数据集。数据集大小约为172GB。
需要注意的是,这些数据集的内存大小都是相对较大的,需要合适的存储设备来存储和处理。同时,不同的数据集之间包含的类别、场景和数据格式都可能不同,需要根据具体的需求进行选择。
相关问题
数据集比较小的可以3d多模态目标检测的室外场景数据集有哪些
针对室外场景的3D多模态目标检测,常用的数据集有以下几个:
1. KITTI数据集:该数据集包含了22个类别的目标,包括行人、车辆、自行车等,其中包含了3D框架和激光雷达数据。
2. nuScenes数据集:该数据集包含了23个类别的目标,包括行人、车辆、自行车等,其中包含了3D框架、激光雷达数据、相机图像和雷达图像。
3. Waymo Open数据集:该数据集包含了多个城市的行驶场景,其中包含了3D框架、激光雷达数据、相机图像和雷达图像。
4. ApolloScape数据集:该数据集包含了多个城市的行驶场景,其中包含了3D框架、激光雷达数据、相机图像和雷达图像。
需要注意的是,以上数据集都是比较大的数据集,不同的数据集之间包含的类别、场景和数据格式都可能不同,需要根据具体的需求进行选择。
除了人工客服的多模态数据集,还有哪些多模态数据集?
根据我的了解,除了人工客服的多模态数据集,还有以下几个多模态数据集:
1. IEMOCAP:包含音频、视频和文本数据,用于情感识别和情感表达分析。
2. EmoReact:包含音频、视频和生理数据,用于情感识别和情感表达分析。
3. AffectNet:包含图像和文本数据,用于情感识别和情感表达分析。
4. CMU-MOSEI:包含音频、视频和文本数据,用于情感和情绪分析。
5. CMU-MOSI:包含音频、视频和文本数据,用于情绪分析。
以上是一些常见的多模态数据集,它们都可以用于情感、情绪等方面的研究和分析。如果您需要更多的多模态数据集,可以在相关领域的会议、期刊等论文中查找。