ONNX Runtime：跨平台高性能机器学习加速器

版权申诉

78 浏览量更新于2024-11-18 收藏 227.77MB ZIP 举报

资源摘要信息:"ONNX Runtime是Microsoft推出的一款旨在优化机器学习推理和训练过程的高性能加速器。该加速器支持跨平台操作，能够提供灵活、高效的运行时环境。ONNX Runtime不仅能够支持多种机器学习框架，如TensorFlow、PyTorch等，还能利用多种硬件加速器，例如CPU、GPU和专用的AI加速器等。其设计目标在于最大化地提升机器学习模型在推理和训练阶段的性能。该加速器的一个显著特点是支持ONNX（Open Neural Network Exchange）格式。ONNX是一个开放的格式，用于表示深度学习模型，允许模型在不同的深度学习框架之间进行转换和共享，从而增加了框架之间的互操作性。ONNX Runtime作为一个运行时环境，可以加载ONNX格式的模型并对其进行高效的推理或训练。 ONNX Runtime的跨平台特性意味着它可以运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这种广泛的兼容性使得开发者可以在不同的开发环境中构建和优化其机器学习模型，并确保它们可以在各种平台上无缝部署。由于ONNX Runtime可以轻松地集成到各种应用程序和服务中，它极大地便利了机器学习应用的部署。开发者可以将ONNX Runtime嵌入到他们现有的应用程序中，而无需对现有的系统架构进行大量的修改。这样一来，开发者就可以专注于创新和优化其机器学习模型，而不是花费大量时间解决部署和集成问题。在性能方面，ONNX Runtime通过优化计算图、执行图优化、核融合（kernel fusion）、内存管理和硬件加速等技术，显著提升了推理和训练的速度。例如，核融合技术可以将多个运算核合并为一个核，减少了计算资源的调度开销，从而加速了模型的执行。除了性能优化之外，ONNX Runtime还提供了强大的调试和诊断工具，帮助开发者监控和优化模型性能。这些工具对于识别和解决性能瓶颈、优化资源分配等问题至关重要。随着人工智能技术的快速发展，对于高性能的机器学习推理和训练加速器的需求日益增长。ONNX Runtime的出现，填补了这一市场需求，为机器学习社区提供了一个强大、灵活且易于部署的工具。它的推出，不仅有助于加速现有模型的推理和训练速度，还有助于推动创新，让开发者能够快速实现复杂模型的部署和应用。通过优化模型的运行时环境，ONNX Runtime可以显著减少机器学习应用在生产环境中的延迟，提高响应速度，这对于实时性要求较高的应用场景至关重要。同时，它的跨平台特性和灵活性，也为机器学习应用的持续集成和持续部署（CI/CD）提供了支持，有助于企业快速迭代和更新其AI产品。综上所述，ONNX Runtime作为一款高性能的机器学习推理和训练加速器，不仅满足了开发者对于效率和灵活性的需求，也为机器学习技术的普及和应用开拓了新的道路。随着技术的不断进步和优化，ONNX Runtime有望成为机器学习开发者不可或缺的工具之一。" 【压缩包子文件的文件名称列表】: onnxruntime-main

收起资源包目录

ONNX Runtime：跨平台高性能机器学习加速器（2000个子文件）

ai_onnxruntime_providers_OrtTensorRTProviderOptions.c 2KB

qgemm_kernel_sse41.cpp 13KB

CustomOps.cpp 28KB

pooling_fp16.cpp 10KB

qgemm_kernel_udot.cpp 22KB

protobufHelpers.cpp 12KB

LearningModelBindingAPITest.cpp 29KB

qpostprocessor.cpp 7KB

RawApiTestsGpu.cpp 6KB

CommonDeviceHelpers.cpp 7KB

module.cpp 6KB

dgemm.cpp 20KB

LearningModelSessionAPITest.cpp 86KB

model_tests.cpp 18KB

D3DDeviceCache.cpp 29KB

qdwconv.cpp 13KB

sqnbitgemm.cpp 20KB

sqnbitgemm_kernel_neon.cpp 40KB

snchwc.cpp 56KB

OnnxruntimeDescriptorConverter.cpp 22KB

q4_dq.cpp 38KB

LearningModel.cpp 13KB

ai_onnxruntime_OnnxTensor.c 17KB

AdapterSessionTest.cpp 14KB

qdwconv_avx2.cpp 7KB

LearningModelSession.cpp 16KB

pooling.cpp 52KB

q4gemm_avx512.cpp 66KB

ai_onnxruntime_OrtTrainingSession_OrtCheckpointState.c 11KB

ai_onnxruntime_OrtAllocator.c 575B

sgemmc.cpp 14KB

qgemm_kernel_sse.cpp 14KB

SgemmKernelWasmSimd.cpp 16KB

convsym.cpp 21KB

VideoFrameToTensorConverter.cpp 35KB

reorder.cpp 26KB

winml_adapter_session.cpp 12KB

qladd_avx2.cpp 8KB

qlgavgpool.cpp 49KB

qgemm.cpp 15KB

OnnxruntimeEngine.cpp 60KB

ai_onnxruntime_OrtSession_RunOptions.c 6KB

qlmul.cpp 18KB

quantize.cpp 55KB

ai_onnxruntime_providers_OrtCUDAProviderOptions.c 2KB

AdapterDmlEpTest.cpp 13KB

imageTestHelper.cpp 11KB

erf.cpp 9KB

ConcurrencyTests.cpp 12KB

qgemm_kernel_smmla.cpp 36KB

winml_adapter_model.cpp 36KB

ImageConversionHelpers.cpp 13KB

compute.cpp 27KB

ai_onnxruntime_OnnxSequence.c 4KB

SgemmKernelPOWER10.cpp 15KB

LearningModelAPITest.cpp 13KB

activate.cpp 12KB

OnnxruntimeEnvironment.cpp 9KB

adapter_test.cpp 12KB

SgemmKernelScalar.cpp 12KB

DgemmKernelPOWER10.cpp 16KB

DeviceHelpers.cpp 6KB

qdwconv_kernelsize.cpp 33KB

qgemm_kernel_ummla.cpp 37KB

sgemm.cpp 40KB

qgemm_kernel_lsx.cpp 15KB

fused_ops_frontend.cpp 10KB

LearningModelBinding.cpp 22KB

qgemm_kernel_avx2.cpp 7KB

qgemm_kernel_sdot.cpp 31KB

sbgemm_kernel_neon.cpp 13KB

ai_onnxruntime_OrtEnvironment_ThreadingOptions.c 4KB

ai_onnxruntime_OrtTrainingSession.c 31KB

SconvDepthwiseKernelScalar.cpp 7KB

scenariotestscppwinrt.cpp 77KB

imagetests.cpp 50KB

convolve.cpp 37KB

q4_dq_cli.cpp 9KB

qgemm_kernel_power10.cpp 47KB

ai_onnxruntime_OnnxRuntime.c 3KB

OrtJniUtil.c 50KB

ort_value_helper.cpp 9KB

qladd.cpp 35KB

qgemm_kernel_wasmsimd.cpp 14KB

transpose.cpp 30KB

ai_onnxruntime_OrtSession_SessionOptions.c 32KB

ai_onnxruntime_OrtEnvironment.c 4KB

TensorToVideoFrameConverter.cpp 36KB

activate_fp16.cpp 33KB

ai_onnxruntime_OrtSession.c 27KB

ImageFeatureValue.cpp 23KB

ai_onnxruntime_OnnxMap.c 6KB

OnnxruntimeModel.cpp 14KB

WinMLTelemetryHelper.cpp 7KB

ai_onnxruntime_OnnxSparseTensor.c 20KB

platform.cpp 23KB

SqueezeNetValidator.cpp 9KB

qgemm_kernel_neon.cpp 34KB

halfgemm.cpp 8KB

qgemm_kernel_amx.cpp 31KB

共 2000 条

UnknownToKnown

粉丝: 1w+
资源: 773

ONNX Runtime：跨平台高性能机器学习加速器

onnxruntime-win-x64-1.14.1

C#使用onnxruntime部署Detic 检测2万1千种类别的物体源码

onnxruntime：ONNX Runtime：跨平台，高性能ML推理和训练加速器

onnxruntime tensorrt

onnxruntime 使用gpu推理

onnxruntime

yolov8部署onnxruntime

onnxruntime gpu c++

同时用onnxruntime和directML进行推理

onnxruntime模块作用

最新资源