李沐物体检测和数据集
时间: 2024-04-12 13:04:45 浏览: 26
李沐是一位著名的计算机科学家,他在物体检测和数据集方面做出了很多贡献。在物体检测方面,他提到了目标检测和图片分类的区别。图片分类是找出主体,而目标检测是在图片中识别所有感兴趣的物体,并知道它们的位置,通常使用边缘框来表示物体的位置。边缘框可以通过4个数字定义,即左上x坐标、左上y坐标、右下x坐标和右下y坐标,或者左上x坐标、左上y坐标、宽度和高度。目标检测数据集一般以每行表示一个物体的方式存放,包括图片文件名、物体类别和边缘框的位置。一个著名的目标检测数据集是COCO,它包含80类物体、330k张图片和1.5M个物体。\[1\]
在数据集方面,李沐创建了一个自定义的Dataset实例,用于加载香蕉检测数据集。这个自定义数据集实例包括了读取数据、获取图片和物体标签以及获取数据集长度的功能。通过这个自定义数据集实例,可以方便地加载和处理香蕉检测数据集。\[2\]
此外,李沐还提供了一个函数用于返回训练集和测试集的数据加载器实例。这个函数可以根据设置的批量大小,加载并返回训练集和测试集的数据加载器实例。在物体检测任务中,一个批量的数据格式通常是(批量大小, 图片中的物体个数, 特征),其中特征包括物体的标号、框的坐标等。\[3\]
#### 引用[.reference_title]
- *1* *2* *3* [动手学深度学习之物体检测和数据集](https://blog.csdn.net/qq_38689352/article/details/119925965)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item]
[ .reference_list ]