掌握TensorRT官方例程：深度学习推理加速实践

需积分: 49 137 浏览量更新于2024-11-21 收藏 348KB ZIP 举报

资源摘要信息:"TensorRT官方例程是NVIDIA推出的一款针对深度学习推理的优化库，旨在为深度学习模型提供高性能的推理能力。通过利用TensorRT，开发者可以在NVIDIA的GPU平台上加速神经网络模型的运行速度，从而实现实时的高性能推理。TensorRT支持多种深度学习框架，包括但不限于TensorFlow, PyTorch, Caffe等。它通过层融合、内核自动调优和低精度推理等多种技术手段，显著提升模型推理效率。在提供的描述中提到了多个TensorRT的官方示例程序： 1. sampleINT8：这是一个使用TensorRT 8位整数精度优化的示例，它可以显著减少模型的内存占用和计算需求，同时保持与32位浮点运算相近的准确性，从而提升推理性能。 2. sampleINT8API：这是一个展示如何使用TensorRT的INT8 API来进行模型优化的示例。它提供了一个编程接口的使用案例，帮助开发者了解如何在代码中实现INT8优化。 3. sampleGoogleNet：GoogleNet是深度学习领域的一个经典卷积神经网络架构。TensorRT提供的这个示例展示了如何对GoogleNet模型进行加速。 4. sampleOnnxMNIST：这个示例展示了如何使用ONNX（Open Neural Network Exchange）格式的模型在TensorRT上进行推理。MNIST是一个手写数字识别数据集，此示例演示了如何将一个简单的MNIST模型优化并运行在TensorRT上。 5. sampleSSD：SSD（Single Shot MultiBox Detector）是一种流行的目标检测算法。TensorRT的这个示例演示了如何对SSD模型进行推理优化。 6. sampleUffSSD：Uff是NVIDIA开发的一个工具，用于将TensorFlow的冻结图转换为UFF（Universal Framework Format）模型。此示例展示了如何使用UFF和TensorRT来优化SSD模型。 7. sampleMovieLensMPS：这是一个演示如何在Apple的Metal Performance Shaders (MPS) 上使用TensorRT的示例。MovieLens是一个推荐系统的数据集，此示例展示了如何优化推荐系统的推理。通过这些示例程序，开发者可以学习到如何利用TensorRT对不同的神经网络模型进行优化，以及如何将这些优化技术应用到实际的项目中。它们不仅涵盖了模型精度的调整（如INT8优化），还包括了模型格式转换（如ONNX和UFF）、以及特定硬件平台（如MPS）上的推理加速。此外，这些例程对于理解和实现深度学习模型的推理加速具有指导意义，可以帮助开发者深入理解TensorRT在推理优化方面的强大功能，从而有效地提升产品的性能和用户体验。" 【结束】

收起资源包目录

Tensorrt官方例程（147个子文件）

sampleCharRNN.cpp 41KB

sampleMovieLensMPS.cpp 28KB

dataWriter.h 2KB

sampleMLP.cpp 18KB

README.md 9KB

likelihood.h 2KB

contextNMT.h 1KB

softmaxLikelihood.cpp 4KB

beamSearchPolicy.h 2KB

README.md 15KB

README.md 18KB

dataReader.h 1KB

beamSearchPolicy.cpp 7KB

README.md 8KB

README.md 16KB

bleuScoreWriter.cpp 7KB

textReader.h 1KB

embedder.h 1KB

sampleINT8API.cpp 32KB

sampleNMT.cpp 59KB

sampleUffFasterRCNN.cpp 26KB

component.h 1KB

README.md 7KB

sampleMNIST.cpp 14KB

pinnedHostBuffer.h 1KB

sampleDynamicReshape.cpp 15KB

sequenceProperties.h 1KB

sampleUffSSD.cpp 16KB

lstmDecoder.cpp 6KB

README.md 10KB

debugUtil.h 2KB

sampleSSD.cpp 15KB

lstmEncoder.h 2KB

sampleUffMaskRCNN.cpp 22KB

componentWeights.h 1KB

slpAttention.h 2KB

README.md 7KB

multiplicativeAlignment.h 2KB

limitedSamplesDataReader.cpp 2KB

sampleUffPluginV2Ext.cpp 24KB

frcnnUtils.h 17KB

README.md 7KB

sampleOnnxMNIST.cpp 11KB

README.md 13KB

README.md 12KB

README.md 9KB

trtexec.cpp 5KB

sampleFasterRCNN.cpp 19KB

contextNMT.cpp 2KB

limitedSamplesDataReader.h 1KB

textReader.cpp 2KB

lstmEncoder.cpp 5KB

likelihoodCombinationOperator.h 1KB

README.md 9KB

README.md 8KB

sampleINT8.cpp 19KB

sampleMovieLens.cpp 23KB

projection.h 1KB

benchmarkWriter.cpp 2KB

attention.h 1KB

debugUtil.cpp 4KB

mrcnn_config.h 5KB

bleuScoreWriter.h 2KB

README.md 12KB

slpEmbedder.cpp 3KB

fp16.h 3KB

slpAttention.cpp 3KB

alignment.h 2KB

textWriter.cpp 1KB

README.md 9KB

sampleMNISTAPI.cpp 16KB

benchmarkWriter.h 1KB

softmaxLikelihood.h 2KB

trtUtil.cpp 1KB

sampleGoogleNet.cpp 9KB

multiplicativeAlignment.cpp 3KB

giexec 964B

textWriter.h 1KB

fcPlugin.h 13KB

samplePlugin.cpp 15KB

lstmDecoder.h 2KB

slpEmbedder.h 2KB

componentWeights.cpp 2KB

deviceBuffer.h 1KB

encoder.h 2KB

vocabulary.h 2KB

vocabulary.cpp 2KB

slpProjection.h 2KB

dataWriter.cpp 2KB

cudaError.h 2KB

sampleUffMNIST.cpp 12KB

README.md 19KB

decoder.h 1KB

README.md 20KB

trtUtil.h 1KB

README.md 8KB

sampleReformatFreeIO.cpp 22KB

README.md 17KB

README.md 12KB

slpProjection.cpp 3KB

共 147 条

T＿T

粉丝: 0
资源: 2

掌握TensorRT官方例程：深度学习推理加速实践

深度学习+TensorRT-8.2.1.8+模型加速部署

XL Driver Library - Description

英伟达TensorRT

Nvidia TensorRT官方例程源代码

fp16tensorRT:基于API的TensorRT模型上的TensorRT半精度推理例程

yolov8使用tensorRT进行c++部署

精品软件工具--《AI嵌入式系统——算法优化与实现》软件工具、例程及教学辅助材料.zip

解决TensorRT安装错误：缺失DLL文件完整清单

TensorRT *.*.*.*在Ubuntu18.04上的安装与配置指南

TI公司USB上位机例程（QT版本）

最新资源

TensorRT ...在Ubuntu18.04上的安装与配置指南