基于深度学习的自动求导编译器设计

深度学习

需积分: 0 54 浏览量更新于2024-08-05 收藏 390KB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

"编译大作业-第二部分1" 在这个项目中，我们继续深入探索编译技术的应用，特别是自动求导的编译器。在第一部分中，我们已经掌握了词法分析、语法分析、中间表示形式（IR Node）、语法树构建、语法树遍历（通过IRVisitor）和代码生成等知识。现在，我们将继续这个方向，利用编译技术做更多有趣的功能，重点放在语法树的变换（一个个pass）上来。自动求导是深度学习中当前必不可少的功能，依赖于梯度优化的算法都摆脱不了求导过程。在深度学习框架中，如Tensorflow、PyTorch，自动求导都是由框架完成的，它们的方法论是，首先形成计算图，然后根据链式法则构建计算梯度的图。为了实现自动求导，我们需要了解计算图的概念。计算图是一种数据结构，用于表示计算过程中的依赖关系。例如，在上面的例子中，我们有一个简单的计算过程： X is a tensor of shape [4, 3, 28, 28] T is a label of shape [4, 8*28*28] Y1 = Conv2d(X, kernel=(8, 3, 3, 3), padding=1, stride=1) # result shape is [4, 8, 28, 28] Y2 = flatten(Y1) # result shape is [4, 8*28*28] loss = mse_loss(Y2, T) # loss is scalar 如果我们想要求出对于X的导数，就要从loss开始求，首先loss对于自己的导数是1，然后求Y2的导数，框架发现Y2用来计算loss时，使用的时mse_loss函数，于是找到了mse_loss函数的导函数grad_mse_loss，用于计算Y2的导数；接着对于Y1，框架又发现Y2是通过flatten函数计算的，所以需要计算flatten函数的导函数grad_flatten，用于计算Y1的导数。在这个过程中，我们可以看到，自动求导需要使用到链式法则和计算图的概念。链式法则是指在计算梯度时，需要将每个中间结果的梯度与前一个结果的梯度相乘，以便计算出最终的梯度。计算图则是用于表示计算过程中的依赖关系的数据结构。在编译技术中，我们可以使用语法树的变换来实现自动求导。语法树的变换是指将语法树中的每个节点变换为对应的梯度计算节点。例如，在上面的例子中，我们可以将Y1节点变换为对应的梯度计算节点，以便计算Y1的梯度。在这个项目中，我们将继续探索编译技术在自动求导中的应用，重点放在语法树的变换上来。我们将使用编译技术来生成自动求导的代码，并且在10个例子上测试正确性。

资源详情

资源推荐

编译大作业

第二部分——自动求导的编译器

1. 前言

在第一部分的作业中，我们做的事情是根据输入的表达式生成C/C++代码，并且在10个例子上测试正确

性（6个公开，4个隐藏）。此时，每位同学手头都应该有一个可用的代码生成器了。回忆我们做这个

project的初衷，我们想要做一个面向当前重要应用——深度学习——的代码生成工具，利用我们编译课

上学习的知识完成这一任务。在第一部分中，我们体会了词法分析、语法分析、中间表示形式（IR

Node）、语法树构建、语法树遍历（通过IRVisitor）和代码生成，并且还可能用到了少数SDD, SDT中

的知识。我们第二次project将继续这个方向，利用编译技术做更多有趣的功能，这一次，我们的重点将

放在语法树的变换（一个个pass）上来，对于变换的设计可能会用到课本上更多的知识（但不一定是严

格局限课本的例子，同学们可以根据实际情况活用）。这一次project可能对于一些同学来说比较困难，

希望通过小组合作，大家都能掌握这个过程中需要的知识和技术。

2. 问题描述

2.1 传统的深度学习框架求导

自动求导是深度学习中当前必不可少的功能（依赖于梯度优化的算法都摆脱不了求导过程）。在深度学

习框架中（如Tensorflow, PyTorch），自动求导都是由框架完成的，它们的方法论是，首先形成计算

图，然后根据链式法则构建计算梯度的图。举一个例子，一个简单的计算过程为：

X is a tensor of shape [4, 3, 28, 28]

T is a label of shape [4, 8 * 28 * 28]

Y1 = Conv2d(X, kernel=(8, 3, 3, 3), padding=1, stride=1) # result shape is [4, 8, 28, 28]

Y2 = flatten(Y1) # result shape is [4, 8 * 28 * 28]

loss = mse_loss(Y2, T) # loss is scalar

如果想要求出对于X的导数（虽然常见情况是对于网络参数求导，而不是网络输入，但这里只是做一个

例子），就要从loss开始求，首先loss对于自己的导数是1，然后求Y2的导数，框架发现Y2用来计算loss

时，使用的时mse_loss函数，于是找到了mse_loss函数的导函数grad_mse_loss，用于计算Y2的导

数；接着对于Y1，框架又发现Y2是通过flatten函数求出来的，于是找到了flatten函数的导函数

grad_flatten，利用这个导函数求出对于Y1的导数，继续向上求X的导数，框架又发现了Conv2d层，于

是找到了对应的卷积求导函数，用于求X的导数。可以看到，这个过程除了链式法则，框架还在不断地

识别正向传播时使用的函数/层的名字，然后在自己的函数库里寻找对应的导函数，框架知道应该找哪个

下载后可阅读完整内容，剩余8页未读，立即下载

AIAlchemist

粉丝: 226
资源: 304

基于深度学习的自动求导编译器设计

编译大作业-第二部分-报告1

编译大作业-第一部分1

哈尔滨工业大学编译原理大作业-张志路

MATLAB在线编译器常见错误处理：快速解决编译难题，提升编译成功率

交叉编译中--host --target --build

交叉编译工具arm-linux-gcc-3.4.1.tar.bz2

交叉编译中--host --target --build和host target build的区别

kile怎么编译stm32-bootloader

如何编译 arm-linux-gnueabih-gdb arm-linux-gnueabih-gdbserver 举例细化步骤

怎样在编译时禁用 -Werror 选项

centos如何源码编译安装libselinux-devel

如何编译 arm-linux-gnueabihf-gdb arm-linux-gnueabihf-gdbserver 并移植到开发板上 举例

.运行一个C程序的步骤是（ ）。 (A)编译->链接->编辑->运行 (B)编辑->编译->链接->运行 (C)编译->编辑->链接->运行 (D)运行->链接->编辑->编译

编译时添加 -lopencv_stitching 怎么做

GCC编译选项fno-tree-partial-pre 禁用的预处理器优化都包括那些，请一一列举

linux下编译安装opencv-python

java反编译工具jd-gui

android 编译jsoncpp-src-0.6.0-rc2

分别详细介绍以下的GCC编译选项的功能原理，每条不少于50字： --param large-function-insns=2800 --param large-stack-frame=208 --param large-function-growth=60 --param prefetch-min-insn-to-mem-ratio=0

在“Linker flags”文本框中，添加编译选项“-Wl,--gc-sections,-s”， 分隔符是,？

最新资源

如何编译 arm-linux-gnueabihf-gdb arm-linux-gnueabihf-gdbserver 并移植到开发板上举例

.运行一个C程序的步骤是（）。 (A)编译->链接->编辑->运行 (B)编辑->编译->链接->运行 (C)编译->编辑->链接->运行 (D)运行->链接->编辑->编译

在“Linker flags”文本框中，添加编译选项“-Wl,--gc-sections,-s”，分隔符是,？