CUDA Host Function DLL导出及引用示例

需积分: 5 184 浏览量更新于2024-10-03 收藏 2.87MB RAR 举报

资源摘要信息: "本示例工程主要展示了如何制作一个导出CUDA中host函数的动态链接库（DLL），以及如何在另一个工程中引用这个DLL。通过这个工程，可以学习到CUDA与C++混编、DLL的创建与使用、以及在Windows平台上使用MSVC编译器进行编译的整个流程。" 在深入了解这个工程之前，首先需要了解一些基础知识。CUDA（Compute Unified Device Architecture）是NVIDIA推出的并行计算平台和编程模型。它允许开发者使用NVIDIA的GPU（图形处理单元）进行高性能计算。host函数指的是在CPU上运行的函数，与之相对的是device函数，即在GPU上运行的函数。 ### CUDA与C++混编 CUDA支持使用C++语言进行编程，这意味着开发者可以将CUDA代码与传统的C++代码混合编写，进而实现复杂的并行计算。在混编过程中，程序员需要区分host和device代码。host代码在CPU上执行，而device代码则在GPU上执行。CUDA提供了一套特殊的扩展关键字（如__global__、__device__等）来区分这两种代码。 ### 动态链接库（DLL）的创建和使用动态链接库（Dynamic Link Library，DLL）是一种封装代码、数据和资源的库文件，它可以被多个应用程序共享。在Windows平台上，DLL文件通常具有.dll扩展名。通过创建和使用DLL，开发者可以将通用代码模块化，便于维护和升级。DLL通常由两部分组成：导出函数和导入函数。导出函数是指那些需要被其他程序调用的函数，而导入函数则是指那些在DLL内部调用外部代码的部分。 ### 使用CUDA_NVCC编译器及g++编译器进行混编在本工程中，使用了CUDA_NVCC编译器来编译CUDA代码，使用g++编译器来编译C++代码。CUDA_NVCC是NVIDIA提供的一个预处理器和编译器，专门用于CUDA代码的编译。它可以处理包含host和device代码的源文件，并将相应的代码分别发送给CPU和GPU编译器。而g++是GCC（GNU Compiler Collection）中的C++编译器。 ### 使用cmake生成.sln文件进行编译 cmake是一个跨平台的自动化构建系统，它使用CMakeLists.txt文件中的指令来生成本地的构建环境，如Makefile或Visual Studio的.sln解决方案文件。在本工程中，cmake被用来生成可以在Windows平台上的MSVC编译器使用的.sln文件。这样，开发者就可以利用Visual Studio IDE（集成开发环境）或命令行工具来编译和运行程序。 ### Windows平台与MSVC编译器 Windows是微软公司开发的一个操作系统，而MSVC（Microsoft Visual C++）是该平台上的一个编译器，它是Visual Studio软件开发环境的一部分。MSVC支持C和C++语言，并且提供了许多扩展，以便更好地利用Windows平台的特性。使用MSVC进行编译时，可以生成适用于Windows系统的可执行文件（.exe）和库文件（如.dll）。 ### 本工程的具体流程 1. 首先，CUDA代码中的host函数需要被标记为导出。这可以通过使用关键字__declspec(dllexport)来实现。 2. 创建CMakeLists.txt文件，设置编译选项，并定义源文件和目标文件。在这里，需要指定CUDA_NVCC编译器和g++编译器的路径，以及设置项目类型和链接库。 3. 使用cmake命令生成.sln解决方案文件。这一步通常在命令行中执行，或者在Visual Studio的开发者命令提示符中进行。 4. 打开生成的.sln文件，在Visual Studio中进行项目的构建、调试和运行。 5. 在需要引用CUDA host函数的工程中，需要设置链接到生成的DLL。这通常通过在工程的链接器设置中添加库文件的路径来实现。 6. 通过include CUDA的头文件来声明要使用的CUDA host函数，然后在C++代码中调用这些函数。通过本示例工程，开发者可以掌握如何制作一个CUDA的host函数导出库，并学习如何在其他工程中引用这个库，从而为基于CUDA的高性能计算项目打下坚实的基础。

收起资源包目录

cuda的host函数的导出库制作的示例工程（199个子文件）

VCTargetsPath.lastbuildstate 220B

CMakeCCompilerId.c 28KB

CUDAApp.log 3KB

CUDAtest_generated_cuda.cu.obj.Release.cmake 13KB

CUDAtest.log 2KB

main.cu 1KB

CompilerIdC.lastbuildstate 232B

Browse.VC.db 392KB

generate.stamp.list 96B

CUDAtest_generated_cuda.cu.obj.Debug.cmake 13KB

CMakeDetermineCompilerABI_CXX.bin 52KB

CUDAApp.lastbuildstate 198B

CMakeDetermineCompilerABI_C.bin 52KB

CUDAApp_generated_main.cu.obj.depend 15KB

ZERO_CHECK.lastbuildstate 198B

CUDAtest.vcxproj.filters 1000B

CUDAApp.vcxproj.filters 998B

CUDAtest_generated_cuda.cu.obj.cmake.pre-gen 13KB

cuda.cu 436B

ZERO_CHECK.Build.CppClean.log 493B

CompilerIdC.exe 15KB

Solution.VC.db 984KB

CUDAtest_generated_cuda.cu.obj.RelWithDebInfo.cmake 13KB

CompilerIdCXX.lastbuildstate 234B

CUDAApp_generated_main.cu.obj.MinSizeRel.cmake 13KB

CMakeDetermineCompilerABI_C.bin 52KB

CompilerIdC.exe 15KB

CUDAtest.dll.recipe 495B

ALL_BUILD.vcxproj.filters 317B

CMakeCCompilerId.obj 2KB

ZERO_CHECK.log 30B

CMakeCCompilerId.c 28KB

ZERO_CHECK.lastbuildstate 198B

CMakeSystem.cmake 395B

cmake.check_cache 86B

CMakeRCCompiler.cmake 212B

CompilerIdC.lastbuildstate 232B

DocumentLayout.json 287B

CompilerIdCXX.exe 15KB

CUDAApp_generated_main.cu.obj.Release.cmake 13KB

CUDAtest_generated_cuda.cu.obj.MinSizeRel.cmake 13KB

CUDAApp_generated_main.cu.obj.cmake.pre-gen 13KB

CUDAtest.ilk 3.01MB

CUDAApp_generated_main.cu.obj 123KB

CUDAtest.lastbuildstate 198B

CMakeCXXCompilerId.obj 2KB

CMakeCXXCompilerId.cpp 29KB

cmake_install.cmake 2KB

CMakeDetermineCompilerABI_CXX.bin 52KB

CUDAtest.pdb 1.49MB

CUDAtest.exp 947B

CUDAtest_generated_cuda.cu.obj 80KB

CUDAApp.ilk 3.22MB

vc140.pdb 444KB

CUDAApp.exp 832B

generate.stamp.list 96B

CUDAtest.dll 712KB

cmake_install.cmake 2KB

CUDAApp.exe.recipe 494B

cmake.check_cache 86B

CMakeCCompiler.cmake 3KB

generate.stamp.depend 3KB

Browse.VC.db 392KB

ZERO_CHECK.vcxproj.filters 560B

vc140.pdb 108KB

VCTargetsPath.lastbuildstate 220B

CMakeCXXCompiler.cmake 6KB

CUDAtest.exp 947B

CUDAApp.lib 2KB

CUDAtest.Build.CppClean.log 2KB

CUDAtest.dll 712KB

CMakeCCompiler.cmake 3KB

Solution.VC.db 976KB

CompilerIdCXX.exe 15KB

DocumentLayout.json 287B

CUDAtest.dll 712KB

CompilerIdCXX.lastbuildstate 234B

CUDAtest.lib 2KB

CUDAApp_generated_main.cu.obj.Debug.cmake 13KB

ZERO_CHECK.vcxproj.filters 560B

CMakeCXXCompilerId.cpp 29KB

CUDAApp_generated_main.cu.obj.RelWithDebInfo.cmake 13KB

ZERO_CHECK.Build.CppClean.log 493B

cudatest.h 338B

CUDAApp.exe 720KB

CUDAtest.pdb 1.49MB

CMakeSystem.cmake 395B

CUDAApp.Build.CppClean.log 2KB

说明.docx 10KB

CMakeCCompilerId.obj 2KB

ZERO_CHECK.log 30B

CMakeCXXCompiler.cmake 6KB

CUDAtest.lib 2KB

CUDAtestConfig.cmake 194B

ALL_BUILD.vcxproj.filters 317B

CUDAApp.pdb 1.91MB

CUDAtest_generated_cuda.cu.obj.depend 10KB

CMakeRCCompiler.cmake 212B

generate.stamp.depend 3KB

共 199 条

颢师傅

粉丝: 2w+
资源: 42

CUDA Host Function DLL导出及引用示例

CUDA开发示例Demo工程

CUDA 常用的函数

cuda:我的自定义 CUDA 示例

CUDA+VS2022MFC程序示例

CUBLAS_Library_cublas_CUDA线性代数函数库文档_版本10.2_

Tango_CUDA:Project Tango设备的示例应用程序，它使用CUDA进行计算。 可用于支持CUDA的其他设备

我的教程专栏，你将绝对能实现CUDA工程化，完全从环境安装到CUDA核函数编程，从核函数到使用相关内存优化，从内存优化到深度学习

CUDA_MEX_CMake:使用 CMake 编译具有 CUDA GPU 支持的 MEX 的示例-matlab开发

NN-CUDA-Example:流行的神经网络工具包调用自定义CUDA运算符的几个简单示例

cuda核函数代码示例

最新资源

Tango_CUDA:Project Tango设备的示例应用程序，它使用CUDA进行计算。可用于支持CUDA的其他设备