从搜索引擎到自动驾驶汽车,人工智能(AI)已经应用于日常生活的方方面面。这与近年来飞跃式的算力进步有很大关系。但 AI 研究的最新结果表明,更简单小巧的神经网络可以更好,更有效且更可靠地解决某些任务。
近日,麻省理工学院计算机科学与人工智能实验室(MIT CSAIL),维也纳工业大学和奥地利科技学院的国际研究团队开发出了一种新型 AI 系统。
这种新颖的 AI 系统受到线虫等细小动物的大脑的启发,其核心控制系统仅用 19 个神经元就能操控车辆,实现自动驾驶。
研究团队表示,该系统比以前的深度学习模型具有决定性的优势。它可以更好地应对噪声的输入,而且由于其构造的简单性,人们可以很好地解释其操作模式,不再是 “复杂的黑匣子”。这种新的深度学习模型现已发布在 Nature Machine Intelligence 上。
谷歌软件工程师兼 AI 研究员 Fran?ois Chollet 表示,“神经回路政策是一种受生物神经元启发的有前途的新架构。它生成的模型非常小,但能处理复杂任务。这种简单性使其更强大,更易解释。”
类似于大脑,人工神经网络由许多单个神经元组成。当一个神经元处于活动状态时,它将向其他神经元发送信号。下一个神经元会收集所有信号,组合起来并决定其自身是否激活。一个神经元影响下一个神经元的方式决定了整个系统的下一次行为。这些参数会在自动学习过程中不断调整,直到神经网络可以解决特定任务为止。
多年来,科学家们一直在研究可以从自然界中学到什么,以改善深度学习。秀丽隐杆线虫是一个典型的研究对象,它只有数量极少的神经元,但仍然表现出非常有趣的行为模式,因为它的神经系统可以用非常高效而和谐的方式处理信息。
麻省理工学院 CSAIL 主任 Daniela Rus 教授表示,“大自然向我们展示了巨大的进步空间。我们的目标是大幅降低复杂性并开发一种新型神经网络架构。”
与之前的深度学习模型相比,新架构的神经元和数学模型都是全新的,单个神经元的信号处理方式遵循了完全不同的数学原理。整个网络非常稀疏,因为并非每个神经元之间都互相连接在一起。这让模型变得更简单。
为了测试新想法,研究团队选择了一项特别重要的任务:自动驾驶汽车并维持在车道上。神经网络将摄像机捕捉的道路图像作为输入值,并自主决定是向右还是向左微调方向。
目前,用来实现自动驾驶等复杂任务的深度学习模型通常拥有数百万个参数。相比之下,新架构仅用到了 7.5 万个可训练参数,规模减少了两个数量级。
新系统由两部分组成:卷积神经网络和控制系统。
摄像机的输入首先会经过卷积神经网络,它仅负责处理视觉数据并从像素中提取结构特征,找到那些有趣和重要的信息,然后将信号传输到车辆的控制系统中。
控制系统部分,又被称为神经回路策略(NCP),可以将感知模块中的数据转换为转向命令,仅包含 19 个神经元,比现有最好模型要小好几个数量级。
两个子系统堆叠在一起并同时接受训练。训练数据来自大波士顿地区,是由人类驾驶员完成的驾驶视频,一同输入网络的还有何在任何给定情况下控制汽车方向的资料 —— 直到系统学会了自动将图像与合适的转向系统联系起来,可以独立处理新情况为止。
该深度学习模型已在自动驾驶汽车上进行了测试。研究人员可以轻易地找出,在驾驶时,神经网络的注意力放在哪里:在这种情况下,是路肩和地平线。
他们还能确定每个神经元在驾驶决策中发挥的作用,即每个神经元的功能和行为。对于规模更大的深度学习模型,是不可能实现这种程度的可解释性的。”
NCP 的鲁棒性也经得住考验。研究人员在输入图像中添加了干扰和噪声,以测试 AI 的应对能力。得益于新神经网络模型和架构,该模型表现出了强大的噪声抵抗力。
研究人员 Ramin Hasani 认为,可解释性和鲁棒性是新模型的两个最主要优势,但它实际上还有更多优点,比如减少训练时间,以及增加在简单系统中实现 AI 的可能性。
“我们的 NCP 可以在广泛应用中进行模仿学习,包括自动化工作和机器人运动,”Hasani 补充称,“这些新发现为 AI 社区拓展了新的方向,生物神经系统中的计算原理可以成为创建高性能可解释 AI 的重要资源,作为现有黑盒机器学习系统的替代品。”