CRAY-1机启动存储器、流水部件及寄存器打入各需1拍,“加”6拍、“乘”7拍、“访存”6拍,下列向量指令串中的向量长度均为N,则指令串最短的执行时间是( )拍 V3←存储器 V4←V0+V1 V2←V4*V3
时间: 2024-03-11 09:45:49 浏览: 123
根据题目中所给的指令,每个指令的执行时间都不同。因此,要求指令串最短的执行时间,需要确定每个指令在执行时的依赖关系,以便尽可能地减少指令之间的等待时间。
根据指令 V3←存储器,我们可以确定 V3 中存储的数据是从存储器中读取的。因此,指令 V4←V0+V1 依赖于指令 V3←存储器 的执行结果。指令 V2←V4*V3 依赖于指令 V4←V0+V1 的执行结果和指令 V3←存储器 的执行结果。
因此,最短的执行时间应该是:启动存储器、流水部件及寄存器打入各需1拍,加法指令和访存指令可以同时执行,所以需要 6+6=12 拍,乘法指令需要等待加法指令的执行结果,因此需要 6+7=13 拍。所以指令串最短的执行时间是 1+12+13=26 拍。
相关问题
8、在CRAY-1上用链接技术进行向量运算 D=Ax (B+C) 假设向量长度N≤64,向量元素为浮点数,且向量B、C已存放在V0和V1中。 用以下三条向量完成上述运算: V3←存储器 //访存取向量A V2←V0 + V1 //向量B和向量C进行浮点加 V4←V2 x V3 //浮点乘,结果存入V4 如果向量寄存器和功能部件之间的数据传送需要1拍,访存功能部件、浮点加功能部件和浮点乘法功能部件所需要的拍数分别为7拍、7拍和9拍。1.画链接示意图。 2.求此链接流水线的通过时间是多少拍? 3.如果向量长度为50,则需多少拍才能得到全部结果?
1. 链接示意图如下:
```
+-------+-------+-------+-------+
| | | | |
+-------+-------+-------+-------+
| | | |
+-------+-------+-------+
| | |
+-------+-------+
|
+--------------+
| |
| 浮点乘法功能部件 |
| |
+--------------+
|
+--------------+
| |
| 浮点加功能部件 |
| |
+--------------+
|
+--------------+
| |
| 访存功能部件 |
| |
+--------------+
|
+--------------+
| |
| 向量寄存器 |
| |
+--------------+
|
+--------------+
| |
| 向量寄存器 |
| |
+--------------+
|
+--------------+
| |
| 向量寄存器 |
| |
+--------------+
```
2. 通过时间计算如下:
- 访存功能部件需要7拍,浮点加功能部件需要7拍,浮点乘法功能部件需要9拍,所以总共需要23拍。
- 由于向量长度为N,每个元素需要进行一次乘法和一次加法操作,所以总共需要进行2N次操作。因此,通过时间为23乘以2N,即46N拍。
3. 当向量长度为50时,通过时间为46N,即46乘以50,等于2300拍。因此,需要2300拍才能得到全部结果。
在 CRAY-1型向量处理机中,若向量长度大于 64时,则采用( )技术。
在 CRAY-1型向量处理机中,若向量长度大于 64时,则采用**分块**技术。CRAY-1型向量处理机是一种采用向量处理方式的超级计算机,它的向量寄存器长度为64,如果向量长度超过了64,就需要采用分块技术将向量分成若干块来处理。具体来说,分块技术是将大向量分成若干个小向量,并将这些小向量依次加载到向量寄存器中进行计算。这样可以充分利用向量寄存器的长度,提高向量计算的效率。
阅读全文