假设某可穿戴设备的主存容量为 4MB,Cache 容量为 16KB,每字块有 8 个字,每字 32 位,为该设备的 CPU 设计一个四路组相联映射(即 Cache 每组内共有 4 个字块)的 Cache,并给出以下几个问题的答案: 1. 划出主存地址字段中各段的位数 2. 设 Cache 的初态为空,CPU 一次从主存第 0,1,2……89 号单元读出 90 个字 (主存一次读出一个字),并重复按此次序读 8 次,问命中率是多少? 3. 若 Cache 的速度是主存的 6 倍,试问有 Cache 和无 Cache 相比,速度约提高多 少倍
时间: 2023-06-26 20:05:58 浏览: 82
1. 假设主存地址字段为 32 位,Cache 的组数为 16KB / 8 字块 / 4 组 = 512 组,每组有 4 个字块,所以每个字块的大小为 8 字 * 32 位/字 = 256 位。则主存地址可以分为三段:标记位(32 - 9 = 23 位)、组索引位(9 位)和块内偏移位(2 位)。
2. 初始情况下,Cache 为空,CPU 一次读取 90 个字。由于采用四路组相联映射,每个组有 4 个块,所以总共有 512 / 4 = 128 组。因此,主存地址的组索引位可以用 7 位二进制数表示(2^7 = 128)。每个组中有 4 个块,所以每个块可以用 2 位二进制数表示。
首先,CPU 读取主存第 0 号单元,其地址为 0x0,标记位为 0x0,组索引位为 0x0,块内偏移位为 0x0。Cache 中没有该块,需要从主存中读取该块,并存入 Cache 的对应组中。由于是四路组相联映射,每组有 4 个块,因此需要替换其中的一个块。具体来说,需要选择组索引位相同的 4 个块中的一个,并将其替换为新读取的块。由于是随机选择的替换策略,因此有 1/4 的概率替换掉正确的块,因此此时命中率为 0。
接下来,CPU 依次读取主存第 1、2、3、...、89 号单元中的字,按照类似的方式进行 Cache 操作。由于 Cache 的容量为 16KB,每个块大小为 256 位,因此 Cache 中能够存储的最多块数为 16KB / 256 位 = 64。一旦 Cache 中已经存满了 64 个块,就需要替换其中的某些块。由于采用的是四路组相联映射,因此每个组中最多只能存储 4 个块,因此 Cache 中最多只能存储 64 / 4 = 16 组。如果当前 Cache 中已经存储了 16 组块,则需要使用替换策略来选择其中的一组块,并将其替换为新读取的块。
当 CPU 读取到主存第 90 号单元中的字时,Cache 中已经存储了 64 个块,且每个组中已经存储了 4 个块。此时,如果 CPU 继续读取主存中的字,就需要根据替换策略来选择一个块替换掉其中的某个块。因此,此时命中率非常低。
最后,CPU 再次从主存中读取第 0 号单元中的字,由于此时 Cache 中已经存储了 64 个块,且每个组中已经存储了 4 个块,因此 Cache 中一定有某个块可以与主存中对应的块匹配。由于是四路组相联映射,因此需要在组内的 4 个块中查找是否有标记位与主存地址中的标记位相同的块。如果找到了这样的块,则说明命中了 Cache;否则,需要替换其中的某个块,并从主存中读取新块存入 Cache。由于是随机替换策略,因此有 1/4 的概率替换掉正确的块,因此命中率为 3/4。
因此,总的命中率为 89 * 3/4 / 90 = 0.75。
3. 假设主存的访问时间为 t,Cache 的访问时间为 t/6。如果使用 Cache,CPU 访问主存中的数据时,首先需要访问 Cache。如果 Cache 命中,则访问时间为 t/6;否则,需要先访问主存,并将数据存入 Cache 中,然后再访问 Cache,访问时间为 t/6 + t = 7t/6。因此,使用 Cache 的平均访问时间为:
(命中率 * t/6) + (未命中率 * (t/6 + t))
= t/6 + (5/6)t * (1 - 命中率)
假设未使用 Cache 时的平均访问时间为 t0,则速度提高的倍数为 t0 / (t/6 + (5/6)t * (1 - 命中率))。根据命中率的计算结果,可得:
速度提高的倍数 = 1 / (1/6 + (5/6) * (1 - 0.75))
= 1 / 0.55
≈ 1.82
因此,使用 Cache 后,速度可以提高约 1.82 倍。