据科学家报道,一个长期存在且极其复杂的关于蛋白质结构和行为的科学问题已经被一种新的人工智能系统有效地解决了。
多年来,总部位于英国的人工智能公司DeepMind的一系列不断进步的神经网络一直令我们赞叹不已,这些神经网络在国际象棋和围棋等复杂游戏中不断击败人类。然而,所有这些渐进式的进步都不仅仅是关于掌握娱乐消遣。
在此背景下,DeepMind的研究人员试图引导他们的人工智能解决更为重要的科学难题——比如,通过预测人类生物学极其微小但至关重要的方面,找到对抗疾病的新方法。
如今,借助最新版本的AlphaFold人工智能引擎,他们似乎真的实现了这个雄心勃勃的目标。50年来,研究人员一直在努力预测蛋白质是如何实现它们的三维结构的,但这并不是一个容易解决的问题。事实上,所有可能的分子结构的数量大得令人难以置信,研究人员推测,要对所有可能的分子结构进行采样,需要比宇宙年龄更长的时间。
尽管如此,如果我们能够解决这个被称为蛋白质折叠问题的谜题,这将是科学上的巨大突破,极大地加速药物发现和疾病建模等方面的研究,并延伸出远远超出健康领域的新应用。出于这个原因,尽管极具挑战,但研究人员一直在合作,在开发蛋白质折叠问题的解决方案方面取得进展。
20世纪90年代开始了一项名为CASP(蛋白质结构预测的关键评估)的严格实验,挑战着科学家们设计出能够预测蛋白质折叠奥秘的系统。如今,CASP实验已经运行了30年,似乎已经产生了迄今为止最有希望的解决方案,DeepMind的AlphaFold以前所未有的准确性对3D蛋白质结构进行了预测。
来自马里兰大学的CASP联合创始人约翰·穆尔特说:“近50年来,我们一直困在这个问题上——蛋白质如何折叠。”“看到DeepMind为这个问题找到解决方案,这是一个非常特殊的时刻。我个人在这个问题上花了这么长时间,在经历了那么多的停歇之后,开始思考我们是否能实现这个目标。”
在实验中,DeepMind为AlphaFold使用了一种新的深度学习架构,该架构能够解释和计算3D蛋白质的“空间图”,预测支撑其折叠结构的分子结构。该系统通过分析包含约17万个蛋白质结构的数据库进行训练,将其独特的技能组合用于今年的CASP挑战,其预测的全球距离测试的中位数得分为92.4 GDT。
这超过了90 GDT的临界值,一般认为这与通过实验方法得到的相同结果具有竞争力。DeepMind表示,它的预测平均只差1.6埃(大约一个原子的宽度)。
“当我看到这些结果时,我几乎从椅子上摔下来,”欧洲分子生物学实验室的基因组学研究员伊万·伯尼说。“我知道CASP有多严格——它基本上确保了计算模型必须执行具有挑战性的从头开始的蛋白质折叠任务。看到这些模型能如此准确地做到这一点,我感到很惊讶。有很多方面需要理解,但这是科学的巨大进步。”
?熟悉该领域的专家们已经承认并赞扬了这一突破,尽管完整的报告和详细的结果还有待观察。英国皇家学会主席、结构生物学家罗摩克里希纳说:“这个计算工作代表了在蛋白质折叠问题上令人震惊的进步,这是一个有50年历史的生物学大挑战。”它发生的时间比该领域的许多人所预测的要早几十年。