STM32L4R9 QSPI Flash 速率优化:从10MB/s到理论值

需积分: 5 1 下载量 80 浏览量 更新于2024-08-03 收藏 429KB PDF 举报
本文档主要讨论了在使用LAT1180与STM32L4R9微控制器配合QuadSPI (Octo-SPI) Flash进行通信时遇到的问题,客户反映其实际读取速度只有10MB/s,远低于理论值。STM32L4R9的官方数据手册支持的QSPI速度通常要高得多,这表明可能存在性能瓶颈。 首先,问题分析部分指出,时钟配置和手册数据表明,10MB/s的读取速率并不合理。在AN4760应用手册中提到,客户系统的IO0到IO3在4线模式下的信号波形显示,每8个时钟周期间有显著的延时,即使增加CPU主频,延时仍然高达200ns。这可能源于STM32L4R9在接收到32位数据(一个word)后,内部数据处理步骤导致的额外时间消耗。 其次,作者怀疑是由于DMA(Direct Memory Access)设置的问题。原始代码中,DMA被配置为byte传输模式,这意味着在32位总线上传输单个字节可能会导致效率降低,从而增加延迟。STM32L4R9的Cortex-M4内核原本支持32位系统总线,因此在byte模式下可能无法充分利用这一优势。 为了解决这个问题,建议修改DMA配置,将数据传输模式改为与系统总线宽度匹配的模式,例如word或半-word,这样可以减少内部数据转换的时间。提供了一个示例代码,提示读者替换STM32Cube_FW_L4_Vxx项目中的main.c文件,同时对程序其他部分如缓冲区大小定义也进行了调整。 提升STM32L4R9与QSPI Flash之间的通信速度的关键在于优化DMA设置,确保数据在32位总线上以连续的32位块传输,减少不必要的数据处理和潜在的性能损失。通过这些调整,理论上可以达到更接近理论速度的读取性能。实践时,需要根据具体项目需求和环境进行调试和验证。