Pytorch Mask-RCNN实现教程：自定义Dataset与Numpy广播机制详解

171 浏览量更新于2024-08-30 收藏 146KB PDF 举报

本文将深入探讨PyTorch框架中Mask-RCNN的实现细节，特别是针对数据处理模块（DataLoader）和自定义Dataset的使用。在PyTorch中，如果你需要创建一个自定义的数据集类以适应特定需求，如mask-rcnn任务，你需要确保继承torch.utils.data.Dataset，并重写其三个核心方法：`__init__`, `__getitem__`, 和 `__len__`。这些方法分别负责初始化、获取单个样本和返回数据集的长度，缺失它们会导致DataLoader无法正确加载数据，引发NotImplementedError。 Numpy广播机制是PyTorch中处理多维数组操作的重要概念。它允许不同形状的数组进行计算，通过填充不足维度使其长度与最长维度匹配。广播规则使得即使数组的形状不完全相同，也能进行有效的数学运算。具体来说，每个维度的长度要么相等，要么为1，否则就会报错。当遇到长度为1的轴时，沿该轴的运算会重复使用该轴上唯一的值。此外，文章还提到了CUDA在PyTorch中的应用扩展。CUDA是NVIDIA的并行计算平台，用于加速深度学习模型在GPU上的运行。在torch.utils.ffi模块中，通过`create_extension`函数可以创建和配置一个FFI对象，以构建PyTorch扩展，这有助于实现与CUDA的交互。如果设置`with_cuda=True`，则会在编译过程中包含CUDA相关的头文件，使模型能够在GPU上运行，从而提高计算效率。在mask-rcnn的具体实现中，这些概念会与图像特征提取、目标检测和实例分割算法紧密相连，比如利用预训练的卷积神经网络(CNN)来提取特征，然后通过mask分支预测物体的边界框和对应的掩码，以及可能的RoIAlign或ROIPooling操作来处理不同大小的区域。理解并有效利用这些技术对于编写高效、可扩展的mask-rcnn模型至关重要。

Pytorch mask-rcnn 实现细节分享实现细节分享

DataLoader

Dataset不能满足需求需自定义继承torch.utils.data.Dataset时需要override __init__, __getitem__, __len__ ，否则DataLoader

导入自定义Dataset时缺少上述函数会导致NotImplementedError错误

Numpy 广播机制：广播机制：

让所有输入数组都向其中shape最长的数组看齐，shape中不足的部分都通过在前面加1补齐

输出数组的shape是输入数组shape的各个轴上的最大值

如果输入数组的某个轴和输出数组的对应轴的长度相同或者其长度为1时，这个数组能够用来计算，否则出错

当输入数组的某个轴的长度为1时，沿着此轴运算时都用此轴上的第一组值

CUDA在在pytorch中的扩展：中的扩展：

torch.utils.ffi中使用create_extension扩充：

def create_extension(name, headers, sources, verbose=True, with_cuda=False,

package=False, relative_to='.', **kwargs):

"""Creates and configures a cffi.FFI object, that builds PyTorch extension.

Arguments:

name (str): package name. Can be a nested module e.g. ``.ext.my_lib``.

headers (str or List[str]): list of headers, that contain only exported

functions

sources (List[str]): list of sources to compile.

verbose (bool, optional): if set to ``False``, no output will be printed

(default: True).

with_cuda (bool, optional): set to ``True`` to compile with CUDA headers

(default: False)

package (bool, optional): set to ``True`` to build in package mode (for modules

meant to be installed as pip packages) (default: False).

relative_to (str, optional): path of the build file. Required when

``package is True``. It's best to use ``__file__`` for this argument.

kwargs: additional arguments that are passed to ffi to declare the

extension. See `Extension API reference`_ for details.

.. _`Extension API reference`: https://docs.python.org/3/distutils/apiref.html#distutils.core.Extension

"""

base_path = os.path.abspath(os.path.dirname(relative_to))

name_suffix, target_dir = _create_module_dir(base_path, name)

if not package:

cffi_wrapper_name = '_' + name_suffix

else:

cffi_wrapper_name = (name.rpartition('.')[0] +

'.{0}._{0}'.format(name_suffix))

wrapper_source, include_dirs = _setup_wrapper(with_cuda)

include_dirs.extend(kwargs.pop('include_dirs', []))

if os.sys.platform == 'win32':

library_dirs = glob.glob(os.getenv('CUDA_PATH', '') + '/lib/x64')

library_dirs += glob.glob(os.getenv('NVTOOLSEXT_PATH', '') + '/lib/x64')

here = os.path.abspath(os.path.dirname(__file__))

lib_dir = os.path.join(here, '..', '..', 'lib')

library_dirs.append(os.path.join(lib_dir))

else:

library_dirs = [] library_dirs.extend(kwargs.pop('library_dirs', []))

if isinstance(headers, str):

headers = [headers] all_headers_source = ''

for header in headers:

with open(os.path.join(base_path, header), 'r') as f:

下载后可阅读完整内容，剩余8页未读，立即下载

weixin_38653694

粉丝: 9
资源: 920

Pytorch Mask-RCNN实现教程：自定义Dataset与Numpy广播机制详解

pytorch-mask-rcnn

mask rcnn训练自己数据，下载更换数据集和路径即可使用

Detectron-maskrcnn 训练自己的数据集

simple-faster-rcnn-pytorch_simple-faster-rcnn-_rcnnpytorch代码_pyt

Mask-RCNN-series:本系列我们将使用Mask RCNN

基于Mask-RCNN的可行驶车道检测技术研究

掌握Mask-Rcnn框架：Python深度学习物体检测详解

Mask-RCNN深度学习模型在ISIC数据集上对皮肤癌图像的分类与分割研究

基于Pytorch和MaskRCNN的高效人体姿态估计算法实现

pytorch maskrcnn

最新资源