yolov5 int8 fp16 性能对比
时间: 2023-08-17 15:10:20 浏览: 155
根据引用\[1\],转化yolov5模型为yolov5s.engine时,使用GPU占用603MiB,转化需要大约3分钟的时间。而根据引用\[2\],相比于INT8量化,FP16量化不需要进行校准,因为FP16在浮点数表示中的精度比INT8更高。因此,FP16量化可以在不牺牲太多精度的情况下,显著减少存储和计算成本。在TensorRT中,可以通过设置相应的标志来启用FP16量化。所以,FP16量化在性能方面可能会更好一些。
#### 引用[.reference_title]
- *1* *3* [基于TensorRT 推理框架yolov5 模型转化 、完美运行 | INT8 和 USE_FP16 时间性能对比 | 详细步骤记录](https://blog.csdn.net/sinat_28442665/article/details/118724773)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item]
- *2* [YOLOV5 INT8 量化对比](https://blog.csdn.net/bobchen1017/article/details/130000176)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item]
[ .reference_list ]
阅读全文