NVIDIA CUDA Math API 参考手册
需积分: 5 115 浏览量
更新于2024-07-15
收藏 2.59MB PDF 举报
CUDA Math API
CUDA Math API是 NVIDIA 公司开发的一套数学函数库,用于在 NVIDIA GPU 上进行高性能的数学计算。该库提供了广泛的数学函数,包括基本的算术运算、指数函数、对数函数、三角函数等。
**Half Precision Intrinsics**
Half Precision Intrinsics 是 CUDA Math API 中的一部分,提供了半精度浮点数的数学运算函数。半精度浮点数是一种 IEEE754 浮点数格式,使用 16 位二进制数字表示浮点数。Half Precision Intrinsics 提供了丰富的数学运算函数,包括加法、减法、乘法、除法、平方根、指数函数、对数函数等。
**Half Arithmetic Functions**
Half Arithmetic Functions 是 Half Precision Intrinsics 的一部分,提供了半精度浮点数的基本数学运算函数。这些函数包括:
* __hadd:半精度浮点数加法
* __hadd_sat:半精度浮点数加法,带饱和处理
* __hdiv:半精度浮点数除法
* __hfma:半精度浮点数浮点乘法
* __hfma_sat:半精度浮点数浮点乘法,带饱和处理
* __hmul:半精度浮点数乘法
* __hmul_sat:半精度浮点数乘法,带饱和处理
* __hneg:半精度浮点数负数
* __hsub:半精度浮点数减法
* __hsub_sat:半精度浮点数减法,带饱和处理
**Half2 Arithmetic Functions**
Half2 Arithmetic Functions 是 Half Precision Intrinsics 的一部分,提供了半精度浮点数的复杂数学运算函数。这些函数包括:
* __hadd2:半精度浮点数加法
* __hadd2_sat:半精度浮点数加法,带饱和处理
* __hfma2:半精度浮点数浮点乘法
* __hfma2_sat:半精度浮点数浮点乘法,带饱和处理
* __hmul2:半精度浮点数乘法
* __hmul2_sat:半精度浮点数乘法,带饱和处理
* __hneg2:半精度浮点数负数
* __hsub2:半精度浮点数减法
* __hsub2_sat:半精度浮点数减法,带饱和处理
**Half Comparison Functions**
Half Comparison Functions 是 Half Precision Intrinsics 的一部分,提供了半精度浮点数的比较函数。这些函数包括:
* __heq:半精度浮点数相等比较
* __hequ:半精度浮点数相等比较,忽略 NaN
* __hge:半精度浮点数大于或等于比较
* __hgeu:半精度浮点数大于或等于比较,忽略 NaN
* __hgt:半精度浮点数大于比较
* __hgtu:半精度浮点数大于比较,忽略 NaN
* __hisinf:半精度浮点数是否无穷大
* __hisnan:半精度浮点数是否 NaN
**Half2 Comparison Functions**
Half2 Comparison Functions 是 Half Precision Intrinsics 的一部分,提供了半精度浮点数的复杂比较函数。这些函数包括:
* __hbeq2:半精度浮点数相等比较
* __hbequ2:半精度浮点数相等比较,忽略 NaN
* __hbge2:半精度浮点数大于或等于比较
* __hbgeu2:半精度浮点数大于或等于比较,忽略 NaN
* __hbgt2:半精度浮点数大于比较
* __hbgtu2:半精度浮点数大于比较,忽略 NaN
* __hble2:半精度浮点数小于或等于比较
* __hbleu2:半精度浮点数小于或等于比较,忽略 NaN
* __hblt2:半精度浮点数小于比较
* __hbltu2:半精度浮点数小于比较,忽略 NaN
450 浏览量
2021-11-22 上传
2023-08-27 上传
2023-08-30 上传
153 浏览量
点击了解资源详情
点击了解资源详情
sinat_38707640
- 粉丝: 61
最新资源
- OSWorkflow中文手册V2.8:开源工作流系统详解
- Tomcat基础教程:安装、配置与实战指南
- Windows环境下TOMCAT集群配置实战指南
- Visual Studio.NET使用技巧:代码编排与注释指南
- 掌握AJAX与DWR:快速开发教程
- Tomcat配置详解:虚拟目录、端口设置与错误页面配置
- DOS命令详解:ping与nbtstat的使用
- IBM DB2 for OS/390 and z/OS: Error Codes and Messages Explained
- JavaScript技巧集锦:右键、复制、框架与安全防护
- 深入解析PHP-Memcached:架构与实现
- Web 登陆会话管理中需要注意的问题
- 嵌入式系统开发入门指南:实战与理论结合
- C#编程中十种常见错误及其处理方法
- 探索Ruby on Rails:Jeremy McAnally的入门指南
- SQL Server开发规范详解:建库建表与最佳实践
- java初学者指南:牛人解析java的面向对象与应用