CMAKE_CUDA_ARCHITECTURES
时间: 2024-06-18 07:05:54 浏览: 481
CMAKE_CUDA_ARCHITECTURES是一个CMake变量,用于指定在CUDA编译期间要生成的代码的架构。该变量允许您指定编译所需的GPU计算能力列表。在编译期间,NVIDIA编译器将生成所有具有大于或等于给定架构要求的指令的代码。
以下是使用CMAKE_CUDA_ARCHITECTURES变量的示例CMakeLists.txt文件:
```cmake
cmake_minimum_required(VERSION 3.17)
project(cuda_example CUDA CXX)
# 设置要编译的GPU计算能力
set(CMAKE_CUDA_ARCHITECTURES 70)
# 添加源文件
add_executable(cuda_example main.cu)
# 指定CUDA标准
set_target_properties(cuda_example PROPERTIES CUDA_STANDARD 14)
```
在此示例中,我们将CMAKE_CUDA_ARCHITECTURES设置为70,这意味着我们要生成的CUDA代码可在计算能力为70的GPU上运行。接下来,我们将源文件添加到可执行文件中,并将CUDA标准设置为14,这将告诉CMake使用CUDA 14进行编译。
相关问题
CMAKE_CUDA_ARCHITECTURES如何设置
### 回答1:
CMAKE_CUDA_ARCHITECTURES可以通过指定一个由逗号分隔的编译器支持的架构列表来设置。例如,要指定支持的架构,可以使用以下表达式:-DCMAKE_CUDA_ARCHITECTURES:=“5.5;5.3;3.5;2.1”
### 回答2:
CMAKE_CUDA_ARCHITECTURES是一个CMake的变量,用于指定要为CUDA编译器生成代码的GPU架构。设置CMAKE_CUDA_ARCHITECTURES可以确保生成的CUDA代码能够在目标GPU上运行,并利用其硬件特性。
CMAKE_CUDA_ARCHITECTURES变量的值应该是一个由GPU架构名称组成的列表。例如,可以使用"sm_30"来表示Compute Capability为3.0的GPU架构。
要设置CMAKE_CUDA_ARCHITECTURES,可以在CMakeLists.txt文件中添加以下一行代码:
set(CMAKE_CUDA_ARCHITECTURES "sm_30")
在这个例子中,将生成适用于Compute Capability为3.0的GPU的CUDA代码。
如果要为多个GPU架构生成代码,可以将它们作为列表元素一一添加:
set(CMAKE_CUDA_ARCHITECTURES "sm_30;sm_35;sm_50;sm_60")
在这个例子中,将生成适用于Compute Capability为3.0、3.5、5.0和6.0的GPU的CUDA代码。
需要注意的是,GPU架构的选择应该根据目标GPU的实际情况进行权衡。选择较新的架构可能会使用更多的硬件特性,但也可能导致对旧GPU的兼容性降低。
总之,通过设置CMAKE_CUDA_ARCHITECTURES变量,可以指定要为CUDA编译器生成代码的目标GPU架构,以便生成适用于目标硬件的代码。
### 回答3:
CMAKE_CUDA_ARCHITECTURES是CMake中一个用于设置CUDA架构的变量。CUDA架构是指用于在NVIDIA的GPU上运行CUDA代码的架构版本。
CMake是一个跨平台的项目构建工具,它允许我们使用统一的语法来配置和生成各种不同平台和编译器的项目。当我们构建一个CUDA项目时,我们需要设置CMAKE_CUDA_ARCHITECTURES变量来指定在哪些CUDA架构下编译代码。
该变量的设置可以通过多种方式来完成。一种常见的方式是在CMakeLists.txt文件中使用set命令来设置该变量。例如,可以通过以下方式设置为Compute Capability 3.0和5.0:
```cmake
set(CMAKE_CUDA_ARCHITECTURES 30 50)
```
另一种方式是使用cmake命令行工具来设置该变量。例如,可以使用以下命令来设置为Compute Capability 6.0和7.0:
```
cmake -DCMAKE_CUDA_ARCHITECTURES="60;70" ..
```
设置CMAKE_CUDA_ARCHITECTURES变量可以让CMake根据所设置的架构版本生成相应的编译指令,以保证生成的可执行文件在指定的CUDA架构上能够正确运行。需要注意的是,如果不设置该变量,默认情况下CMake会将所有检测到的CUDA架构都包含在内。
总结一下,通过设置CMAKE_CUDA_ARCHITECTURES变量,我们可以指定在哪些CUDA架构下编译代码,以确保生成的可执行文件在所指定的架构上能够正确运行。
解释:if(CUDA_FOUND) message(STATUS "Found CUDA Toolkit v${CUDA_VERSION_STRING}") enable_language(CUDA) set(HAVE_CUDA TRUE) if (CMAKE_CUDA_COMPILER_ID STREQUAL "NVIDIA") if(${CUDA_VERSION_STRING} VERSION_GREATER_EQUAL "11.1") execute_process(COMMAND ${CMAKE_CUDA_COMPILER} --list-gpu-code RESULT_VARIABLE EXIT_CODE OUTPUT_VARIABLE OUTPUT_VAL) if(EXIT_CODE EQUAL 0) #Remove sm_ string(REPLACE "sm_" "" OUTPUT_VAL ${OUTPUT_VAL}) #Convert to list string(REPLACE "\n" ";" __CUDA_ARCH_BIN ${OUTPUT_VAL}) #Remove last empty entry list(REMOVE_AT __CUDA_ARCH_BIN -1) else() message(FATAL_ERROR "Failed to run NVCC to get list of GPU codes: ${EXIT_CODE}") endif() elseif(${CUDA_VERSION_STRING} VERSION_GREATER_EQUAL "11.0") set(__CUDA_ARCH_BIN "35;37;50;52;53;60;61;62;70;72;75;80") elseif(${CUDA_VERSION_STRING} VERSION_GREATER_EQUAL "10.0") set(__CUDA_ARCH_BIN "30;32;35;37;50;52;53;60;61;62;70;72;75") elseif(${CUDA_VERSION_STRING} VERSION_GREATER_EQUAL "9.1") set(__CUDA_ARCH_BIN "30;32;35;37;50;52;53;60;61;62;70;72") else() set(__CUDA_ARCH_BIN "30;32;35;37;50;52;53;60;61;62;70") endif() else() message(FATAL_ERROR "Unsupported CUDA compiler ${CMAKE_CUDA_COMPILER_ID}.") endif() set(CUDA_ARCH_BIN ${__CUDA_ARCH_BIN} CACHE STRING "Specify 'real' GPU architectures to build binaries for") if(POLICY CMP0104) cmake_policy(SET CMP0104 NEW) set(CMAKE_CUDA_ARCHITECTURES ${CUDA_ARCH_BIN}) message(STATUS "CMAKE_CUDA_ARCHITECTURES: ${CMAKE_CUDA_ARCHITECTURES}") #Add empty project as its not required with newer CMake add_library(pcl_cuda INTERFACE) else() # Generate SASS set(CMAKE_CUDA_ARCHITECTURES ${CUDA_ARCH_BIN}) # Generate PTX for last architecture list(GET CUDA_ARCH_BIN -1 ver) set(CMAKE_CUDA_FLAGS "${CMAKE_CUDA_FLAGS} -gencode arch=compute_${ver},code=compute_${ver}") message(STATUS "CMAKE_CUDA_FLAGS: ${CMAKE_CUDA_FLAGS}") add_library(pcl_cuda INTERFACE) target_include_directories(pcl_cuda INTERFACE ${CUDA_TOOLKIT_INCLUDE}) endif () endif()
这段代码是CMake脚本,主要用于检测CUDA是否安装,并设置CUDA相关的编译器标志和选项。
首先,它检查CUDA是否被找到,如果有就输出CUDA Toolkit的版本号,并启用CUDA编程语言。然后,它设置了一个名为HAVE_CUDA的变量为TRUE,以表示CUDA已被找到。
接下来,它检查CUDA的编译器ID是否为"NVIDIA",如果是,就根据CUDA版本号设置__CUDA_ARCH_BIN变量,该变量包含了支持的GPU架构。如果CUDA版本号大于等于11.1,则通过执行nvcc命令获取支持的GPU架构列表,并将其存储在__CUDA_ARCH_BIN变量中。如果CUDA版本号在11.0到10.0之间,则设置__CUDA_ARCH_BIN变量为支持的GPU架构列表。如果CUDA版本号在9.1及以下,则设置__CUDA_ARCH_BIN变量为支持的GPU架构列表。
如果CUDA编译器ID不是"NVIDIA",则会输出一个错误信息,表示不支持该CUDA编译器。
最后,它设置了一个名为CUDA_ARCH_BIN的缓存变量,该变量包含了要为哪些GPU架构构建代码的选项。然后,它使用CMake策略CMP0104来设置CMAKE_CUDA_ARCHITECTURES变量,该变量指定要为哪些GPU架构生成代码。如果未设置CMP0104策略,则会设置CMAKE_CUDA_FLAGS变量来指定要为哪些GPU架构生成代码,并将CUDA_TOOLKIT_INCLUDE路径添加到pcl_cuda库的包含目录中。最后,它创建一个名为pcl_cuda的接口库,以便在其他目标中链接CUDA库。
阅读全文