首页yolov5 int8 fp16 性能对比

yolov5 int8 fp16 性能对比

时间: 2023-08-17 15:10:20 浏览: 161

根据引用\[1\]，转化yolov5模型为yolov5s.engine时，使用GPU占用603MiB，转化需要大约3分钟的时间。而根据引用\[2\]，相比于INT8量化，FP16量化不需要进行校准，因为FP16在浮点数表示中的精度比INT8更高。因此，FP16量化可以在不牺牲太多精度的情况下，显著减少存储和计算成本。在TensorRT中，可以通过设置相应的标志来启用FP16量化。所以，FP16量化在性能方面可能会更好一些。 #### 引用[.reference_title] - *1* *3* [基于TensorRT 推理框架yolov5 模型转化、完美运行 | INT8 和 USE_FP16 时间性能对比 | 详细步骤记录](https://blog.csdn.net/sinat_28442665/article/details/118724773)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [YOLOV5 INT8 量化对比](https://blog.csdn.net/bobchen1017/article/details/130000176)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

阅读全文