华为HiAI DDK V320算子规格详细解读

需积分: 0 81 浏览量更新于2024-07-01 收藏 1.5MB PDF 举报

华为HiAI DDK V320算子规格说明1文档详细阐述了华为人工智能开发工具包（HiAI DDK）针对V320芯片的算子特性和规范。这份文档是华为技术有限公司于2020年2月29日发布的版本04，涵盖了NPU（神经处理单元）和CPU算子的相关约束、列表以及使用注意事项。参数说明：文档提供了关于算子约束的详细信息，包括整体约束，这些约束确保了算子在华为HiAI DDK V320环境下的兼容性和性能优化。这涉及到算子的内存管理、计算资源需求以及可能的性能瓶颈。 NPU算子约束： NPU算子主要关注深度学习模型的加速执行，如卷积、池化、矩阵运算等。文档强调了特定算子的操作方式，如stridedSlice（步长切片）和avgpool（平均池化），这些算子在V320硬件上的实现和性能优化策略。 CPU算子列表：除了NPU加速算子，文档还列出了支持在CPU上运行的算子，对于那些不适合或者性能不佳在NPU上执行的算子，开发者可以依赖CPU来完成。这表明华为HiAI DDK提供了多模态计算能力，适应不同场景的性能需求。版权和法律声明：文档明确指出，未经华为许可，禁止复制或传播文档内容。此外，使用第三方软件时需遵循其版权规定，而购买的产品和服务将受华为商业合同约束。文档更新频繁，但仅为指导性，不构成明示或暗示的保证。获取帮助和支持：华为提供申请使用HiAI DDK的途径，通过邮件发送申请，包括公司名称、产品名称、联系信息等内容，通常在5个工作日内会收到反馈。修改记录：文档的修改记录反映了每个版本更新的主要内容，从V310版本的发布，到V320版本的新增算子和功能，体现了华为对技术支持的持续改进。总体来说，这份文档是华为HiAI DDK V320开发人员的重要参考资料，帮助他们理解如何高效地利用该平台上的算子进行模型开发和部署，同时了解如何处理不同算子在不同硬件环境下的适配和优化。

HiAI DDK V320

算子规格说明

2 NPU 算子约束

文档版本 04 (2020-02-29)

序号

算子

含义

边界

一个输入

【参数】

order: uint32；数组

Pooling

池化层

【输入】

一个输入

【参数】



pool: 池化方法，可选，类型：枚

举，取值：MAX=0，AVE=1，

STOCHASTIC = 2，默认为 MAX



pad: 可选，类型：uint32，默认为 0



pad_h: 可选，类型：uint32，默认为



pad_w: 可选，类型：uint32，默认

为 0



kernel_size: 可选，类型：uint32，

kernel_size 和 kernel_h/kernel_w 不能

同时出现



kernel_h: 可选，类型：uint32



kernel_w: 可选，类型：uint32，

kernel_h/kernel_w 必须同时存在



stride: 可选，类型：uint32，默认为



stride_h: 可选，类型：uint32



stride_w: 可选，类型：uint32



engine: 可选，类型：枚举，取值：

DEFAULT=0，CAFFE=1，

CUDNN=2



global_pooling: 可选，类型：bool，

默认值为 false



ceil_mode: 可选，类型：bool，默认

为 true



round_mode: 可选，类型：枚举，取

值：CEIL=0，FLOOR=1；默认为

CEIL

【约束】



KernelH<256, kernelW<256;



stride < 64 ; stride > pad 并且 stride <

input+pad-kernel;



当输出 tensor shape H、W 为 1 时，

要求 input H * input W < 65536

剩余131页未读，继续阅读

我有多作怪

粉丝: 30
资源: 298

华为HiAI DDK V320算子规格详细解读

华为HiAI DDK V320快速集成指南

华为HiAI DDK V320 OMG模型转换指南

"华为HiAI DDK集成手册v2.0：算子兼容性评估及申请流程详解"。

华为HiAI_DDK_V320_版本说明书1

华为HiAI_DDK_V320_OMG工具使用说明1

华为HiAI_DDK_V320_快速入门1

华为HiAI_DDK_V320_缩略语1

华为HiAI_DDK_V320_系统调试工具使用说明书1

华为HiAI_DDK_V320_IR模型构建使用说明书1

华为HiAI_DDK_V320_模型推理集成指导1

最新资源