在openBLAS中_mm_load_ps()具体说明
时间: 2023-12-06 11:02:05 浏览: 174
在OpenBLAS中,_mm_load_ps()是一个函数,用于从内存中加载4个单精度浮点数到一个128位的XMM寄存器中。该函数的语法如下:
```c
__m128 _mm_load_ps (float const* p);
```
其中,p是指向要加载数据的地址的指针。_mm_load_ps()函数将4个连续的单精度浮点数从p指向的地址开始,依次加载到一个128位的XMM寄存器中。
_mm_load_ps()函数的使用可以提高内存数据的读取效率,因为它可以将多个数据一起加载到寄存器中,避免了多次访问内存的开销。但需要注意的是,使用该函数时需要保证要加载的数据是按照128位对齐的,否则可能会导致未定义的行为。如果要加载的数据不是按照128位对齐的,可以使用_mm_loadu_ps()函数代替。
阅读全文