CMAKE_CUDA_ARCHITECTURES如何设置
时间: 2023-09-07 14:11:57 浏览: 1034
CMAKE_CUDA_ARCHITECTURES是一个CMake变量,用于指定CUDA代码的目标GPU架构。可以在CMakeLists.txt文件中设置它。
默认情况下,CMAKE_CUDA_ARCHITECTURES为空,这意味着CUDA代码将使用当前系统上所有可用的GPU架构编译。
要设置CMAKE_CUDA_ARCHITECTURES变量,请将其设置为一个分号分隔的GPU架构列表。例如,要将CUDA代码编译为使用Tesla V100架构,请将其设置为:
```
set(CMAKE_CUDA_ARCHITECTURES 70)
```
您还可以指定多个GPU架构,例如:
```
set(CMAKE_CUDA_ARCHITECTURES "60;70;75")
```
这将使CUDA代码针对CUDA兼容性为6.0、7.0和7.5的GPU进行编译。
相关问题
CMAKE_CUDA_ARCHITECTURES
CMAKE_CUDA_ARCHITECTURES是一个CMake变量,用于指定在CUDA编译期间要生成的代码的架构。该变量允许您指定编译所需的GPU计算能力列表。在编译期间,NVIDIA编译器将生成所有具有大于或等于给定架构要求的指令的代码。
以下是使用CMAKE_CUDA_ARCHITECTURES变量的示例CMakeLists.txt文件:
```cmake
cmake_minimum_required(VERSION 3.17)
project(cuda_example CUDA CXX)
# 设置要编译的GPU计算能力
set(CMAKE_CUDA_ARCHITECTURES 70)
# 添加源文件
add_executable(cuda_example main.cu)
# 指定CUDA标准
set_target_properties(cuda_example PROPERTIES CUDA_STANDARD 14)
```
在此示例中,我们将CMAKE_CUDA_ARCHITECTURES设置为70,这意味着我们要生成的CUDA代码可在计算能力为70的GPU上运行。接下来,我们将源文件添加到可执行文件中,并将CUDA标准设置为14,这将告诉CMake使用CUDA 14进行编译。
解释:if(CUDA_FOUND) message(STATUS "Found CUDA Toolkit v${CUDA_VERSION_STRING}") enable_language(CUDA) set(HAVE_CUDA TRUE) if (CMAKE_CUDA_COMPILER_ID STREQUAL "NVIDIA") if(${CUDA_VERSION_STRING} VERSION_GREATER_EQUAL "11.1") execute_process(COMMAND ${CMAKE_CUDA_COMPILER} --list-gpu-code RESULT_VARIABLE EXIT_CODE OUTPUT_VARIABLE OUTPUT_VAL) if(EXIT_CODE EQUAL 0) #Remove sm_ string(REPLACE "sm_" "" OUTPUT_VAL ${OUTPUT_VAL}) #Convert to list string(REPLACE "\n" ";" __CUDA_ARCH_BIN ${OUTPUT_VAL}) #Remove last empty entry list(REMOVE_AT __CUDA_ARCH_BIN -1) else() message(FATAL_ERROR "Failed to run NVCC to get list of GPU codes: ${EXIT_CODE}") endif() elseif(${CUDA_VERSION_STRING} VERSION_GREATER_EQUAL "11.0") set(__CUDA_ARCH_BIN "35;37;50;52;53;60;61;62;70;72;75;80") elseif(${CUDA_VERSION_STRING} VERSION_GREATER_EQUAL "10.0") set(__CUDA_ARCH_BIN "30;32;35;37;50;52;53;60;61;62;70;72;75") elseif(${CUDA_VERSION_STRING} VERSION_GREATER_EQUAL "9.1") set(__CUDA_ARCH_BIN "30;32;35;37;50;52;53;60;61;62;70;72") else() set(__CUDA_ARCH_BIN "30;32;35;37;50;52;53;60;61;62;70") endif() else() message(FATAL_ERROR "Unsupported CUDA compiler ${CMAKE_CUDA_COMPILER_ID}.") endif() set(CUDA_ARCH_BIN ${__CUDA_ARCH_BIN} CACHE STRING "Specify 'real' GPU architectures to build binaries for") if(POLICY CMP0104) cmake_policy(SET CMP0104 NEW) set(CMAKE_CUDA_ARCHITECTURES ${CUDA_ARCH_BIN}) message(STATUS "CMAKE_CUDA_ARCHITECTURES: ${CMAKE_CUDA_ARCHITECTURES}") #Add empty project as its not required with newer CMake add_library(pcl_cuda INTERFACE) else() # Generate SASS set(CMAKE_CUDA_ARCHITECTURES ${CUDA_ARCH_BIN}) # Generate PTX for last architecture list(GET CUDA_ARCH_BIN -1 ver) set(CMAKE_CUDA_FLAGS "${CMAKE_CUDA_FLAGS} -gencode arch=compute_${ver},code=compute_${ver}") message(STATUS "CMAKE_CUDA_FLAGS: ${CMAKE_CUDA_FLAGS}") add_library(pcl_cuda INTERFACE) target_include_directories(pcl_cuda INTERFACE ${CUDA_TOOLKIT_INCLUDE}) endif () endif()
这段代码是CMake脚本,主要用于检测CUDA是否安装,并设置CUDA相关的编译器标志和选项。
首先,它检查CUDA是否被找到,如果有就输出CUDA Toolkit的版本号,并启用CUDA编程语言。然后,它设置了一个名为HAVE_CUDA的变量为TRUE,以表示CUDA已被找到。
接下来,它检查CUDA的编译器ID是否为"NVIDIA",如果是,就根据CUDA版本号设置__CUDA_ARCH_BIN变量,该变量包含了支持的GPU架构。如果CUDA版本号大于等于11.1,则通过执行nvcc命令获取支持的GPU架构列表,并将其存储在__CUDA_ARCH_BIN变量中。如果CUDA版本号在11.0到10.0之间,则设置__CUDA_ARCH_BIN变量为支持的GPU架构列表。如果CUDA版本号在9.1及以下,则设置__CUDA_ARCH_BIN变量为支持的GPU架构列表。
如果CUDA编译器ID不是"NVIDIA",则会输出一个错误信息,表示不支持该CUDA编译器。
最后,它设置了一个名为CUDA_ARCH_BIN的缓存变量,该变量包含了要为哪些GPU架构构建代码的选项。然后,它使用CMake策略CMP0104来设置CMAKE_CUDA_ARCHITECTURES变量,该变量指定要为哪些GPU架构生成代码。如果未设置CMP0104策略,则会设置CMAKE_CUDA_FLAGS变量来指定要为哪些GPU架构生成代码,并将CUDA_TOOLKIT_INCLUDE路径添加到pcl_cuda库的包含目录中。最后,它创建一个名为pcl_cuda的接口库,以便在其他目标中链接CUDA库。
阅读全文