书书书
小 型 微 型 计 算 机 系 统
Journal of Chinese Computer Systems
2015
年
2
月 第
2
期
Vol. 36 No. 2 2015
收稿日期
: 2013-10-28
收修 改 稿日期
: 2014-11-12
基金 项 目
:
国家自然科学基金项目
( 61462005 )
资助
;
广西自然科学基金项目
( 2014GXSFAA118396)
资助
;
广西教育厅
-
广西大学博士点建设基金项目
( P11900119)
资助
;
广西研究生教育创新计划项目
( YCSZ2013006 )
资
助
.
作者简介
:
陈绪伟
,
男
,1987
年生
,
硕士研究生
,CCF
学生会员
,
研究方向为高性能计算与网络系统
;
钟 诚
,
男
,1964
年生
,
博士
,
教授
,
博士
生导师
,CCF
高级会员
,
研究方向为并行分布计算
、
生物计算高性能算法
.
全局基因调控网络构建
CPU /GPU
并行算法
陈绪伟
,
钟 诚
(
广西大学 计算机与电子信息学院
,
南宁
530004)
E-mail: chzhong@ gxu. edu. cn
摘 要
:
对基因表达谱分块
,
使之符合
GPU
并行计算的线程结构特性
,
根据
GPU
线程结构特性设计双层并行模式
,
并利用纹
理缓存实现访存高效
;
依据
CPU
二级缓存容量对基本块进一步细分成子块以提高缓存命中率
,
利用数据预取技术减少访存次
数
,
利用线程绑定技术减少线程在核心之间的迁移
;
依据多核
CPU
和
GPU
的计算能力分配
CPU
和
GPU
的基因互信息计算任
务以平衡
CPU
与
GPU
的计算负载
;
在设计新的阈值计算算法基础上
,
设计实现了访存高效的构建全局基因调控网络
CPU /
GPU
并行算法
.
实验结果表明
,
与已有算法相比
,
本文算法加速更明显
,
并且能够构建更大规模的全局基因调控网络
.
关 键 词
:
全局基因调控网络
; CPU
与
GPU
协同计算
;
访存高效
;
并行算法
中图分类号
: TP301
文献标识码
: A
文 章 编 号
: 1000-1220( 2015) 02-0234-06
CPU /GPU Parallel Algorithm for Constructing Genome-wide Gene Regulatory Networks
CHEN Xu-wei,Z HONG Cheng
( School of Computer and Electronics and Information,Guangxi University,Nanning 530004,China)
Abstract: Gene expression profile is parted into some basic blocks to conform GPU parallel computing threads structural characteris-
tics,a tw o-level GPU parallel processing mode is designed by using the characteristic of thread structure for GPU,and efficient memo-
ry access is achieved by using texture cache memory. Each basic block is further divided to several sub-blocks according to the capaci-
ty of L2 cache for CPU in order to enhance the hit rate of access cache,the data prefetching techniques are used to reduce memory ac-
cess times
,the thread-bound techniques are used to reduce migration between threads in the core. The tasks to compute mutual infor-
mation between genes are distributed to CPU and GPUs according to their computation ability in order to balance the computation
loads for CPU and GPU. Based on designing a new threshold computation algorithm,this paper proposes the cache-efficient CPU /GPU
parallel algorithms for constructing genome-wide gene regulatory networks. Experimental results show that,compared with the existing
parallel algorithm,our algorithms achieve higher speedup and can construct larger scale genome-wide gene regulato ry networks.
Key words: genome-w ide gene regulatory network; CPU / GPU cooperative computing; efficient access cache; parallel algorithm
1
引 言
随着人类基因组工作草图
、
多种模式生物全基因组序列
获得
,
后基因组时代基因组研究主要焦点已经从测序转向功
能研究
[1]
.
微阵列技术使得分析基因表达谱构建全局基因调
控网络成为可能
,
然而构建基因调控网络非常困难
[2]
:
每一
个真核生物都有几万个基因
,
导致要构建的基因调控网络特
别复杂
;
目前还没有一个很成熟的方法模型
,
从基因表达谱中
分析出基因的调控关系
;
基因表达图谱存在很多噪音和实验
显著性影响
,
加大了基因调控网络构建难度
.
目前构建基因调控网络的模型主要有
:
贝叶斯网络模
型
[3]
和互信息关联模型
[4]
.
贝叶斯网络模型引入有向无圈图
模型和隐马尔可夫链来描述贝叶斯网络变量间的联系及相互
作用
,
来构建调控网络模型
.
但是
,
贝叶斯模型指数级的时间
复杂度导致构建大型全局基因调控网络效率很低
[5]
. Butte
和
IKohane
提出了使用互信息作为检测基因之间的复杂调控关
系的工具
,
实验表明基于互信息的网络模型在构建调控网络
质量上和时间复杂度上都具有明显优势
[4]
.
目前基于互信息
构建基因调控网络的算法大多是串行算法
[6,7]
,
这些串行算
法一般只能构建大约一千个基因的调控网络
.
而真核生物一
般包含几万个基因
,
构建全局基因调控网络需要
10
9
数量级
次互信息计算
.
文献
[2]
在拥有
128
个处理核心的集群上实
现加速比为
12
的构建全局基因调控网络并行算法
.
文献
[8]
在拥有
48
个处理核心的集群上实现了加速比为
40
的构建全
局基因调控网络并行算法
.
这两个算法没有结合多核缓存结
构实现访存高效
,
也没有研究实现
CPU /GPU
协同并行计算
来进一步提高构建全局基因调控网络的效率
.
本文在
CPU /GPU
异构计算平台上设计实现了多核
CPU
与
GPU
协同并行的全局基因调控网络构建算法
,
主要贡献
有
:
设计基因调控网络的并行构建模型
,
设计并实现了新的调
控阈值选取算法
;
设计实现了访存高效的
CPU
与
GPU
协同
并行计算基因对互信息算法
.