mmdetection报错
时间: 2023-09-02 20:11:01 浏览: 98
mmdetection 常见问题及错误记录
5星 · 资源好评率100%
根据引用,当进行多GPU训练时报错,可能是由于并行运算产生的问题或者代码中的错误导致的。一些可能的错误包括通道数不对、没有正确使用所有通道、更新损失时出现问题等。
然而,根据引用,当使用单个GPU运行时没有发现报错。这表明修改网络结构不是问题的原因,而可能是某处的配置没有正确设置。在进行长时间的调试后,发现没有设置`find_unused_parameters=True`。
为了解决这个问题,根据引用中Github上的建议,可以在`torch.nn.parallel.DistributedDataParallel`包装模型时使用`find_unused_parameters=True`选项。具体的修改可以在`mmdet/apis/train.py`文件的第114行进行,将原来的代码`find_unused_parameters = cfg.get('find_unused_parameters', False)`修改为`find_unused_parameters = True`。
这样,模型将使用`torch.nn.parallel.DistributedDataParallel`进行并行训练,并将`find_unused_parameters`参数设置为`True`。这个修改可以避免报错的发生。<span class="em">1</span><span class="em">2</span><span class="em">3</span>
#### 引用[.reference_title]
- *1* *3* [mmdetection学习记录之报错解决汇总](https://blog.csdn.net/qq_42642142/article/details/123032091)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT0_1"}}] [.reference_item style="max-width: 50%"]
- *2* [mmdetection3d报错问题解决汇总](https://blog.csdn.net/QLeelq/article/details/130404416)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT0_1"}}] [.reference_item style="max-width: 50%"]
[ .reference_list ]
阅读全文