科研速递

南京古生物所GBDB地层古生物大数据计算获得突破

发布时间:2017-01-06 作者:
来源:
分享:


CONOP.net的启动界面



超级计算机“天河二号”
 
(化石网报道)据中国科学院南京地质古生物研究所:近日,由中国科学院南京地质古生物研究所自主开发建设的GBDB地层古生物数据库及其并行计算软件,在全球排名第二的超级计算机“天河二号”上成功完成了晚古生代海洋无脊椎生物9000物种数据集的计算工作。该进展表明,南京古生物所在定量地层学的软件开发与应用方面,已经达到世界领先水平。

经过近十年的快速发展,GBDB数据库平台已经积累了来自世界各地的海量的地层古生物数据,在2014和2015年还分别被正式确定为国际地层委员会和国际古生物协会的官方数据库。但随着数据的快速增长,计算能力的不足极大地限制了区域乃至全球地层古生物数据分析的开展。在基金委重大项目“古生代海洋重大生物事件”和创新研究群体等项目的支持下,GBDB数据库团队的樊隽轩、侯旭东、杨娇等从2013年3月开始了定量地层学约束最优化法–CONOP 9的优化工作。2013年5月,樊隽轩、侯旭东与CONOP程序开发者、加州大学河滨分校Peter M. Sadler教授合作完成了CONOP的C#版本–CONOP.net的开发工作,其性能较CONOP 9快3倍左右;2014年,樊隽轩、侯旭东与德国SAP公司南京创新中心的罗琼等合作完成了基于SAP HANA数据库的CONOP.HANA的开发工作,其性能较原始版本提升了约33倍,并由SAP公司无偿租借了一台高性能HP工作站用于高性能计算,这也成为南京古生物所GBDB数字地层学实验室部署的第一台高性能计算硬件平台。

随着GBDB数据库数据的快速增长,以及华南古生代生物多样性计算工作的启动,上述程序的计算能力再次遇到瓶颈。因此,从2015年夏天起,GBDB数据库团队决定利用前沿的并行计算技术与超级计算机,彻底解决计算瓶颈问题。经过1年的艰苦攻关,GBDB团队在2016年夏天完成了第一个并行计算版本-CONOP.Para 1.0的开发工作,该程序可发挥单机或工作站上多核CPU的性能,从而实现数倍到十余倍的速度提升(取决于CPU的颗数和核数)。2016年11月,GBDB数据库团队携手中科曙光团队利用MPI并行技术,融合了模拟退火算法和遗传算法,完成了超算版本-CONOP.Para 2.0的开发,并在我院计算机网络信息中心超级计算中心的超级计算机“元”上完成了100核至5000核的测试工作。由于“元”的体量较小,难以调度5000核以上的资源进行后续测试,因此GBDB数据库团队在全球排名第二的超级计算机“天河二号”上申请机时开始了万核以上的测试工作,并于近期利用1万核成功完成了晚古生代海洋无脊椎生物9000物种数据集的计算工作,其加速比为6/10核,也即在“天河二号”的1万核上可实现6000倍左右的性能提升。

CONOP.Para 2.0是定量地层学领域全球第一个成功在超级计算机上运行并通过正确性测试的软件,其成功开发,表明南京古生物所GBDB数据库团队在定量地层学的软件开发与应用方面,已经达到世界领先水平。2017年,GBDB数据库团队将利用这一软件和超级计算机“天河二号”重建中国古生代海洋无脊椎动物的多样性演化历史,并在这一软件基础上开发生命演化的多媒体可视化系统。


附件: