NVIDIA CUDA Math API 参考手册
需积分: 5 61 浏览量
更新于2024-07-15
收藏 2.59MB PDF 举报
CUDA Math API
CUDA Math API是 NVIDIA 公司开发的一套数学函数库,用于在 NVIDIA GPU 上进行高性能的数学计算。该库提供了广泛的数学函数,包括基本的算术运算、指数函数、对数函数、三角函数等。
**Half Precision Intrinsics**
Half Precision Intrinsics 是 CUDA Math API 中的一部分,提供了半精度浮点数的数学运算函数。半精度浮点数是一种 IEEE754 浮点数格式,使用 16 位二进制数字表示浮点数。Half Precision Intrinsics 提供了丰富的数学运算函数,包括加法、减法、乘法、除法、平方根、指数函数、对数函数等。
**Half Arithmetic Functions**
Half Arithmetic Functions 是 Half Precision Intrinsics 的一部分,提供了半精度浮点数的基本数学运算函数。这些函数包括:
* __hadd:半精度浮点数加法
* __hadd_sat:半精度浮点数加法,带饱和处理
* __hdiv:半精度浮点数除法
* __hfma:半精度浮点数浮点乘法
* __hfma_sat:半精度浮点数浮点乘法,带饱和处理
* __hmul:半精度浮点数乘法
* __hmul_sat:半精度浮点数乘法,带饱和处理
* __hneg:半精度浮点数负数
* __hsub:半精度浮点数减法
* __hsub_sat:半精度浮点数减法,带饱和处理
**Half2 Arithmetic Functions**
Half2 Arithmetic Functions 是 Half Precision Intrinsics 的一部分,提供了半精度浮点数的复杂数学运算函数。这些函数包括:
* __hadd2:半精度浮点数加法
* __hadd2_sat:半精度浮点数加法,带饱和处理
* __hfma2:半精度浮点数浮点乘法
* __hfma2_sat:半精度浮点数浮点乘法,带饱和处理
* __hmul2:半精度浮点数乘法
* __hmul2_sat:半精度浮点数乘法,带饱和处理
* __hneg2:半精度浮点数负数
* __hsub2:半精度浮点数减法
* __hsub2_sat:半精度浮点数减法,带饱和处理
**Half Comparison Functions**
Half Comparison Functions 是 Half Precision Intrinsics 的一部分,提供了半精度浮点数的比较函数。这些函数包括:
* __heq:半精度浮点数相等比较
* __hequ:半精度浮点数相等比较,忽略 NaN
* __hge:半精度浮点数大于或等于比较
* __hgeu:半精度浮点数大于或等于比较,忽略 NaN
* __hgt:半精度浮点数大于比较
* __hgtu:半精度浮点数大于比较,忽略 NaN
* __hisinf:半精度浮点数是否无穷大
* __hisnan:半精度浮点数是否 NaN
**Half2 Comparison Functions**
Half2 Comparison Functions 是 Half Precision Intrinsics 的一部分,提供了半精度浮点数的复杂比较函数。这些函数包括:
* __hbeq2:半精度浮点数相等比较
* __hbequ2:半精度浮点数相等比较,忽略 NaN
* __hbge2:半精度浮点数大于或等于比较
* __hbgeu2:半精度浮点数大于或等于比较,忽略 NaN
* __hbgt2:半精度浮点数大于比较
* __hbgtu2:半精度浮点数大于比较,忽略 NaN
* __hble2:半精度浮点数小于或等于比较
* __hbleu2:半精度浮点数小于或等于比较,忽略 NaN
* __hblt2:半精度浮点数小于比较
* __hbltu2:半精度浮点数小于比较,忽略 NaN
2020-09-29 上传
2019-08-26 上传
2015-08-05 上传
2015-08-05 上传
2022-09-14 上传
sinat_38707640
- 粉丝: 60
- 资源: 4
最新资源
- 黑板风格计算机毕业答辩PPT模板下载
- CodeSandbox实现ListView快速创建指南
- Node.js脚本实现WXR文件到Postgres数据库帖子导入
- 清新简约创意三角毕业论文答辩PPT模板
- DISCORD-JS-CRUD:提升 Discord 机器人开发体验
- Node.js v4.3.2版本Linux ARM64平台运行时环境发布
- SQLight:C++11编写的轻量级MySQL客户端
- 计算机专业毕业论文答辩PPT模板
- Wireshark网络抓包工具的使用与数据包解析
- Wild Match Map: JavaScript中实现通配符映射与事件绑定
- 毕业答辩利器:蝶恋花毕业设计PPT模板
- Node.js深度解析:高性能Web服务器与实时应用构建
- 掌握深度图技术:游戏开发中的绚丽应用案例
- Dart语言的HTTP扩展包功能详解
- MoonMaker: 投资组合加固神器,助力$GME投资者登月
- 计算机毕业设计答辩PPT模板下载