从Feature到Queries 到Linear Mk到softmax到Linear Mv到output 帮我从这个角度解释external attention

时间: 2024-02-22 17:01:38 浏览: 115

人工智能从小白到大神（案例·视频）-手工搭建神经网络

### 人工智能从小白到大神：手工搭建神经网络 #### 一、TensorFlow与PyTorch的安装与使用概述本章节重点介绍了如何从零开始安装并使用TensorFlow这一流行的深度学习框架，以及如何利用其核心功能搭建神经网络模型。通过对TensorFlow的深入探讨，读者不仅能了解其安装流程，还能掌握基本的模型构建方法。 #### 二、TensorFlow的安装 ##### 1. 使用Anaconda安装TensorFlow **步骤1**：访问Anaconda官网 (<https://www.anaconda.com/>) **步骤2**：点击页面右上角的Download按钮进入下载页面。 **步骤3**：下载适用于您操作系统的Anaconda版本。通常情况下，Anaconda会提供针对Windows、macOS和Linux的版本。下载完成后，双击.exe文件按照安装向导的指引完成安装过程。 - **图5-1**：Anaconda官网截图。 - **图5-2**：Anaconda版本选择页面。 **步骤4**：安装完成后，打开Anaconda Navigator或Anaconda Prompt进行后续操作。 ##### 2. 安装TensorFlow（离线安装法） - **步骤1**：下载TensorFlow的安装包。以TensorFlow 1.4.0为例： - CPU版本下载路径：<https://storage.googleapis.com/tensorflow/windows/cpu/tensorflow-1.4.0-cp35-cp35m-win_amd64.whl> - GPU版本下载路径：<https://storage.googleapis.com/tensorflow/windows/cpu/tensorflow_gpu-1.4.0-cp35-cp35m-win_amd64.whl> - **步骤2**：假设将安装包存放在E:/tensorflow目录下，通过命令行安装TensorFlow。具体命令如下： ```bash C:\Users\Administrator>E: E:\>cd tensorflow E:\tensorflow>pip install tensorflow-1.4.0-cp35-cp35m-win_amd64.whl ``` 这些命令依次表示：切换到E盘、进入tensorflow文件夹、安装TensorFlow。 #### 三、TensorFlow基本用法 ##### 1. 模型搭建常用函数 - `with tf.Session() as sess:` 开启TensorFlow的Session。 - `tf.constant(a)` 定义TensorFlow常量。 - `tf.Variable(a)` 定义TensorFlow变量。 - `tf.convert_to_tensor(a)` 将Python数组转化为TensorFlow中的张量。 - `tf.placeholder(shape, dtype)` 创建一个占位符，用于在运行时向模型中填充数据。 ##### 2. 基本数学运算函数 - `tf.add(a, b)` 执行加法运算。 - `tf.subtract(a, b)` 执行减法运算。 - `tf.matmul(a, b)` 执行矩阵乘法。 - `tf.div(a, b)` 执行除法运算。 ##### 3. 卷积和池化函数 - `tf.Variable(tf.random_normal([in_filters, out_filters, filter_size, filter]))` 初始化权重。 - `tf.nn.conv2d(x, w, strides=[1,1,1,1], padding="SAME")` 执行2D卷积操作。 - `tf.nn.max_pool2d(Conv1_relu, ksize=(2,2), strides=[1,2,2,1], padding="SAME")` 执行最大池化操作。 ##### 4. 激活函数 - `tf.sigmoid()` Sigmoid激活函数，将输入映射到0~1之间。 - `tf.tanh(h)` 双曲正切激活函数，将输入映射到-1~1之间。 - `tf.nn.relu(h)` ReLU激活函数，对于负的输入值，神经元不会激活；对于正的输入值，神经元的输出与输入值相同。 - `tf.nn.softmax(h)` Softmax激活函数，一个神经元的输出不仅取决于其自身的输入值，还取决于该层中存在的所有其他神经元的输入的总和。 ##### 5. 损失函数 - `tf.square(y - y_hat)` 标准线性回归模型损失函数，其中`y`代表标签，`y_hat`代表模型的真实输出。通过上述介绍，我们可以了解到TensorFlow提供了丰富的API来帮助我们快速构建复杂的神经网络模型，并且能够轻松地进行训练和评估。无论是对于初学者还是有一定经验的研究者来说，这些都是非常有价值的工具和技术。

从"Feature到Queries到Linear Mk到softmax到Linear Mv到output"的角度来解释External Attention，可以将其分为以下几个步骤： 1. Feature：首先，输入序列经过一层线性变换，得到一组特征向量，表示输入序列中每个位置的信息。 2. Queries：然后，对于待处理的当前位置，将其特征向量通过另一层线性变换，得到一个查询向量（query），表示该位置的特征。 3. Linear Mk：接下来，将所有位置的特征向量再通过一层线性变换，得到一组键向量（keys），表示每个位置的特征对应的键（key）。 4. Softmax：然后，通过将当前位置的查询向量与所有位置的键向量做点积，得到一组相似度得分（similarity scores），表示当前位置与每个位置之间的相似程度。接着，通过对相似度得分进行softmax操作，将它们归一化为一个概率分布，得到每个位置的权重（weights）。 5. Linear Mv：接着，将所有位置的特征向量再通过一层线性变换，得到一组值向量（values），表示每个位置的特征对应的值（value）。 6. Output：最后，将每个位置的值向量乘以对应的权重，再将它们加权求和，得到当前位置的表示（output）。综上所述，External Attention通过从输入序列中寻找与当前位置相关的信息，并对这些信息进行加权求和，实现了模型对输入序列中重要信息的捕捉和处理。

阅读全文

从Feature到Queries 到Linear Mk到softmax到Linear Mv到output 帮我从这个角度解释external attention

相关推荐

从逻辑回归到最大熵模型.pdf

NLP进入预训练模型时代：从word2vec,ELMo到BERT.pdf

softmax运算

Softmax Regression

Softmax回归

softmax回归

softmax regression

基于python实现softmax回归softmax Regression

Softmax分类器

log_softmax

softmax函数推导

softmax回归代码

deeping leraning Softmax

Softmax.rar

softmax.zip

RBF-Softmax

MATLAB Softmax Regression

深度学习损失函数解析：从Euclidean到Softmax Loss

最新推荐

Softmax函数原理及Python实现过程解析

PyTorch: Softmax多分类实战操作

softmax的交叉熵导数推导.docx

探索数据转换实验平台在设备装置中的应用

管理建模和仿真的文件

ggflags包的国际化问题：多语言标签处理与显示的权威指南

如何使用MATLAB实现电力系统潮流计算中的节点导纳矩阵构建和阻抗矩阵转换，并解释这两种矩阵在潮流计算中的作用和差异？

使用git-log-to-tikz.py将Git日志转换为TIKZ图形

"互动学习：行动中的多样性与论文攻读经历"

ggflags包的定制化主题与调色板：个性化数据可视化打造秘籍