地学高性能计算实验室:核心定位与总体架构
地理数据与应用分析中心地学高性能计算实验室始建于2016年12月,是地理科学学部重点建设用于提升科研信息化水平的重大基础设施。自成立以来,实验室以地理学区域性、综合性、复杂性研究需求为导向,以支撑高效、多元地理计算为目标,在梳理国内外典型海量时空数据应用场景与框架结构基础上,逐步整合并行计算(包括MPI、Map/Reduce、GPU)、内存计算(SPARK)、云计算(VMware)、分布式存储(HDFS)等计算模式,形成形式多样、安全高效的地理数据“清洗-加载-管理-分析-表达”一体化计算环境。
目前,实验室在计算资源方面主要包括一组并行计算平台、一组胖节点平台、一组云计算平台、一组HADOOP计算平台、一组GPU处理平台以及一组高性能计算服务器,双精度浮点计算峰值35万亿次 (Tflops)以上,总CPU核数超过500,总内存超5000GB。各类计算平台综合应用56Gbps FDR Infiniband网络与万兆光纤网络连接,并集成多台防火墙与堡垒机设备,全面保障高效安全的数据吞吐环境。
实验室自2018年9月投入运行以来,以助力地理数据科学分析方法体系研究,推动地理学第四范式发展为目标,主机资源得到充分有效地利用,并为土壤-水文过程模拟、全球温度变化、全球贸易分析、地缘关系分析、耕地质量评价等多项研究提供服务支持,充分发挥了公共服务平台的重要作用。
实验室工程设计
实验室网络拓扑
平台总体架构
时空数据多层级格网组织体系[1]
[1] Ye Sijing, Liu Diyou, Yao Xiaochuang, Tang Huaizhi, Xiong Quan, Zhuo Wen, Du Zhengbo, Huang Jianxi, Su Wei, Shen Shi, Zhao Zuliang, Cui Shaolong, Ning Lixin, Zhu Dehai, Cheng Changxiu*, Song Changqing*. RDCRMG: A Raster Dataset Clean & Reconstitution Multi-Grid Architecture for Remote Sensing Monitoring of Vegetation Dryness[J]. Remote Sens. 2018, 10, 1376