文/陈根
人工智能(AI)发展至今,已成为社会生活和生产中一种非常真实的力量。这种力量将会,甚至已经,颠覆了世界上的几乎所有行为。随着机器人、智能手表、智能音箱、虚拟助理等科技产品的出现,人工智能技术的迅猛发展及其在医疗卫生领域的深度应用,将极大改变原有社会的面貌。
目前,人工智能在医疗卫生领域广泛应用正形成全球共识。可以说,人工智能以独特的方式捍卫着人类健康福祉。除了在诊疗手术、就医管理、医疗保险领域发挥作用,基于算法的人工智能近年来更是推动着疾病与药物研究的革新,并越来越体现其优势。
制药业作为一个古老悠久又对人类至关重要的行业,人工智能何以成为制药业未来趋势?在人工智能制药全面到来之前,制药业还将面临什么挑战?
AI制药,潜力无限
制药业是危险与迷人并存的行业。通常,一款药物的研发可以分为药物发现和临床研究两个阶段。
在药物发现阶段,需要科学家先建立疾病假说,发现靶点,设计化合物,再是展开临床前研究。而传统药企在药物研发过程中则必须进行大量模拟测试,研发周期长、成本高、成功率低。根据《自然》数据,一款新药的研发成本大约是26亿美元,耗时约10年,而成功率则不到十分之一。
其中,仅发现靶点、设计化合物环节,就障碍重重,包括苗头化合物筛选、先导化合物优化、候选化合物的确定、合成等,每一步都面临较高的淘汰率。
对于发现靶点来说,需要通过不断的实验筛选,从几百个分子中寻找有治疗效果的化学分子。此外,人类思维有一定趋同性,针对同一个靶点的新药,有时难免结构相近、甚至引发专利诉讼。最后,一种药物,可能需要对成千上万种化合物进行筛选。即便这样,也仅有几种能顺利进入最后的研发环节。
然而,通过人工智能技术却可以寻找疾病、基因和药物之间的深层次联系,以降低高昂的研发费用和失败率。基于疾病代谢数据、大规模基因组识别、蛋白组学、代谢组学,AI可以对候选化合物进行虚拟高通量筛选,寻找药物与疾病、疾病与基因的链接关系,提升药物开发效率,提高药物开发的成功率。
具体而言,科研人员可以使用人工智能的文本分析功能搜索并剖析海量文献、专利和临床结果,找出潜在的、被忽视的通路、蛋白、机制等与疾病的相关关系,进一步提出新的可供测试的假说,从而找到新机制和新靶点。渐冻人症(ALS)就是由特定基因引起的一类罕见病,而IBM Watson使用人工智能技术来检测数万个基因与ALS的关联性,成功发现了5个与ALS相关的基因,推进了人类对渐冻人症的研究进展(此前医学已发现了3个与ALS相关基因)。
在候选化合物方面,人工智能可以进行虚拟筛选,帮助科研人员高效找到活性较高的化合物,提高潜在药物的筛选速度和成功率。比如,美国Atomwise公司使用深度卷积神经网络AtomNet来支持基于结构的药物设计辅助药品研发,通过AI分析药物数据库模拟研发过程,预测潜在的候选药物,评估新药研发风险,预测药物效果。制药公司Astellas与NuMedii公司合作使用基于神经网络的算法寻找新的候选药物、预测疾病的生物标志物。
当药物研发经历药物发现阶段,成功进入临床研究阶段时,则进入了整个药物批准程序中最耗时且成本最高的阶段。临床试验分为多阶段进行,包括临床I期(安全性),临床II期(有效性),和临床III期(大规模的安全性和有效性)的测试。
传统的临床试验中,招募患者成本很高,信息不对称是需要解决的首要问题。CB Insights的一项调查显示,临床试验延后的最大原因来自人员招募环节,约有80%的试验无法按时找到理想的试药志愿者。
临床试验中的一大重要部分,在于严格遵守协议。简言之,如果志愿者未能遵守试验规则,那么必须将相关数据从集合当中删除。否则,一旦未能及时发现,这些包含错误用药背景的数据可能严重歪曲试验结果。此外,保证参与者在正确时间服用正确的药物,对于维护结果的准确性也同样重要。
但这些难点却可以在人工智能技术下被解决。比如,人工智能可以利用技术手段从患者医疗记录中提取有效信息,并与正在进行的临床研究进行匹配,从而很大程度上简化了招募过程。
对于实验的过程中存在的患者服药依从性无法监测等问题,人工智能技术可以实现对患者的持续性监测,比如利用传感器跟踪药物摄入情况、用图像和面部识别跟踪病人服药依从性。苹果公司就推出了开源框架ResearchKit和CareKit,不仅可以帮助临床试验招募患者,还可以帮助研究人员利用应用程序远程监控患者的健康状况、日常生活等。
AI制药,时候未到
既然人工智能已经展现出了在制药业领域的优势和潜力,为什么人工智能制药产业至今还未密集爆发?反而是人们对人工智能领域不断取得的突破屡见不鲜。对于“人工智能算法因发现了一种强效的新抗生素”之类的头版新闻并不再感到稀奇。
新冠肺炎疫情是对人工智能的一块试金石,在协助诊疗和管理上,人工智能的表现可圈可点。
然而,对于制药来说,尽管国内有阿里云与全球健康药物研发中心GHDDI合作开发人工智能药物研发和大数据平台,针对冠状病毒的历史药物研发进行数据挖掘与集成,国外有DeepMind使用其AlphaFold人工智能系统来预测和发布与新冠病毒相关的结构。就像人工智能掌握了古老的中国棋盘游戏围棋一样,人工智能在制药上显示了巨大希望。然后呢,并没有答案。
此外,尽管科技进步颠覆了移动通讯,个人电脑,互联网和基因测序等等领域,开发新药的成本却在稳步上升。人工智能制药为这个领域吸引了更多投资和更多人才。但随着炒作愈演愈烈,药物开发成本却一路走高。于是,一直以来,看起来很有希望的人工智能技术突破,却并没有带来研发水平的显著提高。
人工智能制药似乎依旧不堪大用。究其根本,还在于当今的人工智能存在的固有局限性。对于目前的人工智能来说,其主要还是通过在数据中寻找模式来学习的。通常,输入的数据越多,人工智能就越智能。
总部位于旧金山的OpenAI发布的GPT-3算法,只需几个词的提示就可以写出任何主题的连贯段落。值得一提的是,第一版GPT于2018年发布,包含1.17亿个参数。2019年发布的GPT-2包含15亿个参数。相比之下,GPT-3拥有1750亿个参数,比其前身多100倍,比之前最大的同类NLP模型要多10倍。于是,该算法通过分析近5千亿个单词实现了智能。然而这些数据也限制了GPT-3。
要实现超自然的性能,一般来说,必须输入模拟特定行为的高质量数据对系统进行训练。这在围棋等游戏中容易实现,每一步都有明确的参数,但在不太可预测的现实生活场景中则要困难得多。这也使得人工智能在应用到现实场景的过程中,经常会遇到困难。
疫情期间,在法国、美国等地,人工智能之所以也未能支持政府建立有效的接触者追踪系统的努力,很大一部分原因就是缺少必要的“原料”。在英国,由于缺乏系统的数据采集来追踪和溯源新冠病例,短期内几乎不可能使用人工智能技术实施接触者追踪干预。
当然,即便人工智能可以创造出人类急需的药品,改善健康,治疗疾病。但无论是生成强化学习等方法的结合,还是量子计算的迷人前景,都需要生物学、化学以及更多学科的支持。只有保证科学的供给,才能更好地产出科学。
生活水平提升引起的人口结构变化和疫苗、抗生素等医学技术的出现加快了人类疾病谱变迁的速度,慢性病取代传染病成为人类主要的疾病负担。目前的医疗卫生体系是人类在对抗传染病和急性病过程中形成的。医学理念、临床干预方式难以应对慢性病的挑战,逐渐表现出效率低下,医疗保健成本高速增长等特征,日趋不堪重负。
人工智能技术的巨大突破,融合了深度学习算法、数据建模、大规模GPU并行化平台等技术构成的深度神经网络,能模拟人脑的工作机制。国家可以在提升早期检测准确度、加强诊断和风险控制、降低治疗费用、辅助病人自我健康管理、提升治疗效果等方面给予医疗工作者充分支持。
在制药行业从识别生物靶点,设计新分子,到提供个性化治疗和预测临床试验结果方面,人工智能制药更是具有巨大潜力。目前,人工智能制药或许依然会输给传统的生物学和化学,但这并不意味着它还没有准备好进入黄金期。未来,随着医疗大数据的形成与完善,患者检查、诊断、治疗全过程的数字化之后,AI就能通过自动学习来研发药物。可以预见,不久的将来,随着AI制药黄金期的到来,也将给制药这一历史悠久且至关重要的行业带来前所未有的变革。