中国科学院广州生物医药与健康研究院同事眼中的“三剑客”正在讨论问题
中国科学院超算环境广州分中心一角 黄博纯供图
在一间普通的机房里,隐藏着雷霆万钧的“大家伙”。这些宝贝被精心呵护,科学家通过它们,破解生命科学、新材料、新能源等领域不可或缺的重要密码。
位于中国科学院广州生物医药与健康研究院(以下简称广州健康院)内的中国科学院超算环境广州分中心(以下简称超算中心)凭借以计算能力在干细胞与再生医学、创新药物设计、公共健康、海洋气象、地球科学、环保能源新能源等领域都有广泛的应用。
“过去一年来,超算中心支撑干细胞先导专项、国家重点研发计划及省市专项项目超过200项。”超算中心主任陈朝明表示,“在2019年的指数排名中,该中心在中科院各超算分中心中位列第一名。”
“我们就是一个湖泊”
超算中心重点不在“超”而是擅长“算”,数据分析支撑科学研究。成立时间虽短,超算中心持续面向全院师生开展常用分析语言和方法的培训。截止2020年9月,面向中科院广州分院各研究所、生物岛实验室、高校及广州科学城相关企业等开通账号357个,培训应用账号90个,集群平均使用率达65%。
“从超算资源量来讲,如果把天河二号比喻为大海,那我们就是一个湖泊。”陈朝明如是说。超算中心于2014年正式获得中科院批准、依托广州健康院建设和管理,目前集群拥有:60台普通刀片计算节点,1000个CPU计算核心,全系统内存容量6TB,存储总容量达到3PB,整体聚合计算能力理论峰值达每秒100万亿次。
超级计算机被称为“国家重器”,属于国家战略高技术领域,也是世界各国竞相角逐的科技制高点。目前,超算中心主要应用在生物学、基础医学、 生物医学工程、药学等13个领域,用户覆盖30个科研组左右,最多时有超过100名分析人员同时在线进行计算。
“生物学实验、尤其是药物研发,涉及的数据量大、算力要求高,基于AI技术构建完整的生物医药计算平台,对于健康数据管理、理性药物设计等科研活动具有极大的价值,高效稳定的网络和数据支撑也是重中之重。”广州健康院研究员刘劲松说,“做好每个细节是作为实验支撑平台的责任与担当。”
“三剑客”的故事
不同的学科背景,为了共同的目标,广州健康院研究员刘劲松、许永与陈朝明成为了同事口中的“三剑客”。
超算中心建立之初,由于经费紧张和大家对超算认识的不足,三剑客采取“化缘”的方式,号召院领导及PI,“有钱出钱,有力出力,没钱没力出吆喝。”终于在中科院、广州健康院的大力支持下,采取“经费支持+服务先租后购+课题组支持” 的方式,超算中心才得以建成。
该中心建成后,“三剑客”仍然对其日常运维和未来发展倾注了大量精力,像对待自己的孩子一样,呵护有加。有一次,广州健康院内突然停电,他们不约而同,第一时间到达超算机房,检查服务器、存储系统,确保设备安然无恙。随着广州健康院科研实力和人才队伍的不断壮大,超算资源也面临诸多挑战。
“依靠平台的专业技术支持,在小实验室,也可以做大科学。我们相信,未来重大的科研发现和创新,可以从这里开始孕育、诞生。”这是“三剑客”对超算中心的定位,也是他们的笃信。
中国科学院计算机网络中心研究员金钟表示,广州健康院高度重视超算对科研创新的驱动,连续几年在超算发展指数中位于中科院前列,基于该超算分中心,产出了一大批重大科研项目及重大成果,培养了一大批生物医药计算交叉学科人才。
小平台撬动大科学
工欲善其事,必先利其器。随着高通量和单细胞测序技术的不断发展,干细胞与再生医学、药物设计、公共健康与免疫等领域产生大规模数据,对于计算资源和计算能力的需求越来越大。超算中心正不断助力广州健康院细胞命运调控、遗传发育、抗癌药物筛选及蛋白质结构解析等方向的数据分析,大大提升了科研效率。
今年1月24日,当大批医护人员奔赴疫情防控第一线的时候,当广州健康院科学家披上实验服开始科研攻关的时候,超算中心的工程师也迅速集结。疫情期间,超算高性能集群不间断、高速稳定运行,保障新冠病毒多种测序数据的高效分析,帮助科学家得以在短期内发现新冠病毒感染导致急性呼吸窘迫症细胞机理,对临床治疗具有重要指导意义。
广州健康院院长陈新文说,数据计算逐渐成为世界各国争夺的新战略资源,是“卡脖子”技术的关键一环,超算中心将以参与新一代超级计算机研制、承担人类细胞谱系大科学设施建设、粤港澳科创中心建设等重大任务为契机,充分发挥超算中心作用,为研究院提升承担大项目能力,申建重大科研基地、产出大成果提供更强力的基础支撑。
未来,超算中心将不再满足提供单一方向的设备和技术支持,而是将联合各个子平台的特长和优势,依靠平台的自主创新,提供全面的技术解决方案,支持科学家挑战生命科学领域影响深远的课题。