CANN训练营：2023 TIK C++算子开发实战

需积分: 0 94 浏览量更新于2024-08-04 1 收藏 2.33MB DOCX 举报

"CANN训练营第一季TIK C++算子开发主要涵盖了C++语言在AI计算领域的应用，特别是针对核函数的编写、调用以及算子执行模型的讲解，适用于CPU和NPU两种模式下的功能与性能调试。课程通过示例介绍了如何利用内置宏进行模式选择，并提供了常用数据结构和矢量计算指令的使用方法。" 在C++算子开发中，核函数是关键组件，它们在并行计算中扮演着核心角色。核函数是执行特定计算任务的函数，尤其在GPU或AIcore等并行硬件上运行。在CANN-TIK中，核函数的定义通常包括函数类型限定符和内联标识，例如`__global__/__aicore__ void kernel_name(argument_list)`。`__global__`指示函数将在全局内存上运行，而`__aicore__`则是特定于AIcore的限定符。核函数的调用采用内核调用符`<<< >>>`形式，如`kernel_name<<<blockDim, 12, ctrl, stream>>>(argument_list)`。这里的`blockDim`定义了线程块的维度，`12`可能代表每个线程块内的线程数量，`ctrl`可能是控制参数，而`stream`则指定了执行流，用于管理并发操作。算子执行模型分为CPU模型和NPU（神经处理单元）模式。在CPU模式下，算子功能的调试主要关注算法正确性和效率优化；而在NPU模式下，除了功能验证外，还会涉及硬件加速性能的调试。为了适应这两种模式，课程中引入了内置宏`_CCE_KT_TEST__`来进行条件编译。当`#ifdef _CCE_KT_TEST__`时，代码将在CPU模式下编译，而`#ifndef _CCE_KT_TEST__`则对应NPU模式。课程中还提到了两个常用的数据定义：`GlobalTensor`和`LocalTensor`。这些数据结构可能分别代表全局内存中的张量和局部内存中的张量，是实现计算任务的基础。矢量计算指令允许开发者有效地利用AIcore的向量单元进行计算，提高运算速度和效率。总结来说，CANN训练营的这个课程旨在教授学员如何利用C++进行AI算子的开发，特别是针对核函数的编写和优化，以及在不同硬件平台上的调试技巧。通过学习，开发者将能够更好地理解和利用硬件资源，提升AI应用的性能。

CANN-TIK算子开发

核函数

核函数编写

○ 函数类型限定符+void+核函数名（参数列表）；例：__global__ /__aicore__ void

kernel_name(argument list)

■ 函数类型限定符

■ 变量类型限定符

下载后可阅读完整内容，剩余5页未读，立即下载

捂耳听风.

粉丝: 0
资源: 1

CANN训练营：2023 TIK C++算子开发实战

【2023·CANN训练营第一季】直播课笔记 2023.3.16 零基础带你入门昇腾AI（上）配套文档

小北的技术博客：探索华为昇腾CANN训练营与AI技术创新-Ascend C算子开发能力认证考试（中级）

昇腾AI入门：2023 CANN训练营直播笔记（上）

0152-极智AI-解读昇腾CANN TBE算子开发方式

算子开发实战，探秘昇腾芯片编程.pdf

CANN 5.1.RC2 算子清单 (Ascend 310) 01.chm

0508-极智开发-解读昇腾CANN AMCT量化环境安装

0121-极智AI-解读昇腾开发环境搭建CANN+MindStudio的方法

opencv4.9.0 with cann

海思平台CANN软件包

最新资源