期刊简介
当前位置:首页 > 期刊导读 > 2013 > 10 > 正文

利用Galaxy与高性能计算集群构建本地化一站式生物信息学平台

作者: 王小磊 ; 李江域 ; 毛逸清 ; 刘阳 ; 王玉峰 ; 赵东升

摘要:目的构建本地化的高性能一站式数据分析平台,为生物医学研究的相关科研人员提供便捷高效的计算分析服务。方法将Galaxy软件部署在计算集群上,集成工具软件和数据集;利用分布式资源管理应用接口(DRMAA)实现与SunGridEngine的协同运作,自动调度和分配计算资源;并在集群上构建稳定的weh服务、FrP服务和管理数据库。结果该平台已投入试运行并在不断完善,峰值计算能力达到每秒lO万亿次,存储容量为40TB,提供序列比对、短串映射、基因注释、转录组分析、宏基因组分析及进化分析等多种功能,以及容量约为700GB的人类基因组、病毒、细菌、真菌等参考数据库。结论该平台具备大规模数据分析的能力,能够解决高通量测序所带来的海量生物数据的存储与处理等问题。与在普通服务器上进行数据分析相比,该平台的计算集群能极大地加快数据处理过程,提高研究效率。


关键字: 本地化    一站式    生物信息学    Galaxy    在线分析    高性能计算      


上一篇:神经性毒剂损伤防治药物研究进展
下一篇:基于CUDA的BLASTN加速研究