CUDA编程解决大数据计算：斯皮尔相关系数与P值

184 浏览量更新于2024-08-27 收藏 211KB PDF 举报

"CUDA编程, 斯皮尔相关系数, P值, 计算规模, 时间复杂度, 空间复杂度, MATLAB多线程, Python多线程, Spark分布式计算" 在本次的CUDA编程经历中，面对的是一项计算密集型任务，涉及9879896条数据，每条数据包含30个整数，目标是计算所有可能的两两组合之间的斯皮尔曼相关系数和P值。初始估计中，这项任务看似并不庞大，因为原始数据仅500+MB。然而，经过计算，发现需要处理大约4.88亿亿组数据，这揭示了时间和空间复杂度的问题。首先，计算规模的大小立即显露出问题的挑战性。数据以9879896行30列的形式排列，每列之间由空格分隔。每个计算结果包括一个相关系数和一个P值，如果以float类型存储，则需要4.88亿亿组数据乘以8字节，总计约400TB的存储空间。由于实际内存限制，数据必须分批加载、计算和保存，这是一个典型的外存储计算问题。接着，讨论到空间复杂度。考虑到并非所有计算结果都需要存储，只有P值小于或等于0.05的结果才会被输出，这意味着实际所需的存储空间远小于400TB。为了预估实际存储需求，需要通过实际运行一批数据来确定。在时间复杂度方面，计算量为(n×(n-1))÷2，即组合的数量，这取决于算法的效率。为了衡量效率，计划对比MATLAB的多线程、Python的多线程以及Spark的分布式计算方案。在MATLAB多线程的尝试中，利用MATLAB内置的并行计算功能，可以轻松启动与物理核心数量相等的worker进行计算。例如，4核8线程的机器能开启4个worker。MATLAB代码简洁，仅需调用相应函数即可计算相关系数和P值。虽然MATLAB提供了方便，但其并行能力受到硬件限制。对于更大型的计算任务，可能需要探索Python的多线程或Spark的分布式计算解决方案，这些方法通常能处理更大的数据集并提供更好的扩展性。此CUDA编程的经历涉及到如何有效管理和优化大规模数据计算，包括理解计算规模、评估时间与空间复杂度，以及选择合适的并行计算框架来提高效率。通过对比不同编程环境和工具的性能，可以为今后的高性能计算项目提供宝贵的经验。

# coding=utf-8

import math

import multiprocessing

import time

import scipy.stats as stats

def calculate2(i, X, all_glb, data_array_glb):

all = all_glb.value

result = []

for j in range(i + 1, all):

x = X

y = data_array_glb[j]

if math.fsum(x) == 0 or math.fsum(y) == 0:

continue

corr, p = stats.spearmanr(x, y)

if p > 0.05:

continue

result.append([i + 1, j + 1, corr, p])

return result

if __name__ == "__main__":

multiprocessing.freeze_support()

input_file = 'D:/MASTER2016/5.CUDA/data-ID-top30-kv3.txt'

output_file = 'D:/MASTER2016/5.CUDA/result-python.txt'

print '>> loading ...'

start = time.clock()

data = open(input_file)

data_array = []

for line in data:

data_array.append(map(int, line.strip().split(' ')))

data.close()

print time.clock()-start, 's'

print '>> calculating ...'

results = []

pool_size = 8

pool = multiprocessing.Pool(processes=pool_size)

all = len(data_array)

manager = multiprocessing.Manager()

all_share = manager.Value('i', int(all))

data_array_share = manager.list(data_array)

for i in range(all):

data_X = data_array[i]

results.append(pool.apply_async(calculate2, args=(i,

data_X, all_share, data_array_share)))

pool.close()

pool.join()

print time.clock() - start, 's'

data_array = None

print '>> saving ...'

data2 = open(output_file, 'w')

for res in results:

temp_list = res.get()

for temp in temp_list:

data2.write('X'+str(temp[0])+'\t'+'X'+str(temp[1])

+'\t'+str(temp[2])+'\t'+str(temp[3])+'\n')

print time.clock()-start, 's'

data2.close()

剩余13页未读，继续阅读

weixin_38691739

粉丝: 6
资源: 958

CUDA编程解决大数据计算：斯皮尔相关系数与P值

cuda.rar_V2

浙大唐敏GPU课程的4次平时作业的完整代码和完整报告

记一次 win10 TensorFlow-GPU 安装

strassen-cuda:Strassen矩阵乘法算法的CUDA实现

cuda图像缩放展示.pptx

cuda 程序 包括了二维和三维VTI介质正演模拟和逆时偏移成像，二维TTI介质逆时偏移成像

实验记录1

端午节et-mai开发比记

CUDA并行计算下的三角函数查表法全息算法优化

CUDA并行计算PI值与GPU/CPUE性能比较研究

最新资源

cuda 程序包括了二维和三维VTI介质正演模拟和逆时偏移成像，二维TTI介质逆时偏移成像