ARM920T详解：16K Cache原理与全相联设计优化

5星 · 超过95%的资源需积分: 9 48 浏览量更新于2024-08-27 收藏 87KB DOCX 举报

ARM920T的Cache是针对ARM920T处理器设计的一种高速缓存系统，用于提升处理器对内存数据的访问速度。本文档提供了一篇深入介绍ARM920T Cache工作原理的文章，特别关注于数据Cache部分。ARM920T集成了16K的数据Cache和16K的指令Cache，它们虽然大小相同，但数据Cache增加了写回内存的机制。 Cache的工作原理基于数据块（CacheLine）的概念，每个CacheLine大小为32字节，而16K的Cache由512条这样的CacheLine组成。为了定位特定数据，Cache利用虚拟地址（VA）的Tag来标记数据来源，即VATag[4]，这部分包含了VA的低四位和末尾五位，以确保地址对齐。这种设计被称为全相联Cache，因为任何VA的32字节数据片段都可以映射到任意一条CacheLine上。查找过程涉及将VA的Tag与Cache中的所有Tag进行比较，当找到匹配的CacheLine时，再通过VA的其他部分（如偏移地址）确定要访问的具体字节。然而，全相联Cache的查找时间复杂度较高，因为可能需要遍历整个Cache（512次）。为减少查找时间，文章提到了一种优化方式，即限制某个VA固定映射到某一条CacheLine，这称为直接映射或组相联Cache，这样查找速度会显著提高，因为只需检查一次就能确定命中与否。此外，Cache还包括了CacheMiss和CacheHit的概念。当目标数据不在Cache中时，会发生CacheMiss，此时处理器会从主内存中读取数据，并将其加载到Cache中，随后进行处理。CacheHit则表示所需数据已存在于Cache中，可以迅速获取，从而减少了内存访问延迟。 ARM920T的Cache设计是现代处理器架构中提高性能的关键组件，通过优化查找策略和缓存分配，有效降低了内存访问的延迟，提升了系统的整体性能。理解这些细节对于深入研究和优化ARM处理器的性能至关重要。

ARM920T 的 Cache（介绍 Cache 最好的一篇文

章）

ARM920T 有 16K 的数据 Cache 和 16K 的指令 Cache，这两个 Cache 是基本相同的，

数据 Cache 多了一些写回内存的机制，后面我们以数据 Cache 为例来介绍 Cache 的基本

原理。我们已经知道，Cache 中的存储单位是 Cache Line，ARM920T 的一个 Cache

Line 是 32 字节，因此 16K 的 Cache 由 512 条 Cache Line 组成。要了解 Cache 的基本

原理，我们从如何设计 Cache 这个问题入手。

设计 Cache 的一种最朴素的想法是，把 VA 分成以 32 字节为单位，从任何一个对齐到 32

字节地址边界的 VA 开始连续的 32 个字节（比如 0x00-0x1f，0x20-0x3f，0x40-0x5f

等等）都可以缓存到 512 条 Cache Line 中的任何一条。那么一条 Cache Line 中的 32

个字节怎么知道是来自哪个 VA 的呢？这就需要把 VA 也保存在 Cache 中，由于这 32 字

节的起始地址是对齐到 32 字节地址边界的，末 5 位全为 0，因此只需要保存 VA[31:5]即

可，这称为 VA Tag[4]，Tag 是 VA 的一部分，是 Cache Line 中数据的标识，表明这 32

字节数据来自哪个 VA。这样设计的 Cache 称为全相联 Cache（Fully Associative

Cache），图示如下：

图 1. 全相联 Cache

给定一个 VA，如何在 Cache 中查找对应的数据呢？首先到 Cache 中比较查找哪一行的

Tag 等于 VA[31:5]，找到对应的 Cache Line 后，再根据 VA[4:0]决定要访问的是该

Cache Line 缓存的 32 个字节中的哪一个字节。由于有 512 条 Cache Line，如果这个

VA 没有缓存在 Cache 中则需要比较 512 次才知道，这是最坏的情况，也是最常见的情况，

下面我们要改进 Cache 的设计来解决这个问题。

全相联 Cache 的特点是任何 VA 都可以缓存到任何一条 Cache Line，给定一个 VA 做查

找时，由于它有可能缓存在 512 条 Cache Line 中的任何一条，就只好全部都找一遍了。

如果限定某一个 VA 只允许缓存在某一条 Cache Line 中，那么查找的过程就快多了：检

查一下应该缓存这个 VA 的那条 Cache Line，看 Tag 一致不一致，如果一致就是 Cache

Hit，如果不一致就是 Cache Miss，可以直接访问物理内存而不必再找其它 Cache Line

了。这种设计称为直接映射 Cache（Direct Mapped Cache），如下图所示：

下载后可阅读完整内容，剩余3页未读，立即下载

xiaohengtonxue

粉丝: 0
资源: 2

ARM920T详解：16K Cache原理与全相联设计优化

arm920t mmu和cache介绍

ARM920T Technical Reference Manual

arm920t的mmu与cache

已知ARM920T微处理器的存储块类型为极小页，请绘出其虚拟地址到物理地址的转换过程。

config_smp 会影响arm a7 cache配置吗

ARM芯片的Cache命中统计方法

[ ] ARM errata: Cache maintenance by set/way operations can execute out of order 介绍

ARM Cortex-R5F 芯片的Cache原理

arm CACHE指令

最新资源