NVIDIA CUDA Math API 参考手册

需积分: 5 5 下载量 61 浏览量 更新于2024-07-15 收藏 2.59MB PDF 举报
CUDA Math API CUDA Math API是 NVIDIA 公司开发的一套数学函数库,用于在 NVIDIA GPU 上进行高性能的数学计算。该库提供了广泛的数学函数,包括基本的算术运算、指数函数、对数函数、三角函数等。 **Half Precision Intrinsics** Half Precision Intrinsics 是 CUDA Math API 中的一部分,提供了半精度浮点数的数学运算函数。半精度浮点数是一种 IEEE754 浮点数格式,使用 16 位二进制数字表示浮点数。Half Precision Intrinsics 提供了丰富的数学运算函数,包括加法、减法、乘法、除法、平方根、指数函数、对数函数等。 **Half Arithmetic Functions** Half Arithmetic Functions 是 Half Precision Intrinsics 的一部分,提供了半精度浮点数的基本数学运算函数。这些函数包括: * __hadd:半精度浮点数加法 * __hadd_sat:半精度浮点数加法,带饱和处理 * __hdiv:半精度浮点数除法 * __hfma:半精度浮点数浮点乘法 * __hfma_sat:半精度浮点数浮点乘法,带饱和处理 * __hmul:半精度浮点数乘法 * __hmul_sat:半精度浮点数乘法,带饱和处理 * __hneg:半精度浮点数负数 * __hsub:半精度浮点数减法 * __hsub_sat:半精度浮点数减法,带饱和处理 **Half2 Arithmetic Functions** Half2 Arithmetic Functions 是 Half Precision Intrinsics 的一部分,提供了半精度浮点数的复杂数学运算函数。这些函数包括: * __hadd2:半精度浮点数加法 * __hadd2_sat:半精度浮点数加法,带饱和处理 * __hfma2:半精度浮点数浮点乘法 * __hfma2_sat:半精度浮点数浮点乘法,带饱和处理 * __hmul2:半精度浮点数乘法 * __hmul2_sat:半精度浮点数乘法,带饱和处理 * __hneg2:半精度浮点数负数 * __hsub2:半精度浮点数减法 * __hsub2_sat:半精度浮点数减法,带饱和处理 **Half Comparison Functions** Half Comparison Functions 是 Half Precision Intrinsics 的一部分,提供了半精度浮点数的比较函数。这些函数包括: * __heq:半精度浮点数相等比较 * __hequ:半精度浮点数相等比较,忽略 NaN * __hge:半精度浮点数大于或等于比较 * __hgeu:半精度浮点数大于或等于比较,忽略 NaN * __hgt:半精度浮点数大于比较 * __hgtu:半精度浮点数大于比较,忽略 NaN * __hisinf:半精度浮点数是否无穷大 * __hisnan:半精度浮点数是否 NaN **Half2 Comparison Functions** Half2 Comparison Functions 是 Half Precision Intrinsics 的一部分,提供了半精度浮点数的复杂比较函数。这些函数包括: * __hbeq2:半精度浮点数相等比较 * __hbequ2:半精度浮点数相等比较,忽略 NaN * __hbge2:半精度浮点数大于或等于比较 * __hbgeu2:半精度浮点数大于或等于比较,忽略 NaN * __hbgt2:半精度浮点数大于比较 * __hbgtu2:半精度浮点数大于比较,忽略 NaN * __hble2:半精度浮点数小于或等于比较 * __hbleu2:半精度浮点数小于或等于比较,忽略 NaN * __hblt2:半精度浮点数小于比较 * __hbltu2:半精度浮点数小于比较,忽略 NaN