在不久前,美国国防部高级研究计划局(DARPA)举办的"阿尔法狗斗试验"(AlphaDogfight)决赛中,美国Heron Systems(苍鹭系统)公司的AI算法(以下简称阿尔法)在虚拟空战中,以5:0的压倒性优势击败了驾驶虚拟F-16战斗机的人类飞行员,在世界军事领域掀起了滔天大浪,军迷纷纷呼喊"人工智能空战时代要来了"、"人类完蛋了",其实,这种过度估计技术影响确实是不必要的。因为AI现在只适合打游戏,还远不能侵入真实世界呢。
其实想想都能明白,仿真游戏环境下,人类看到的是飞机、高原、导弹和大炮,但在计算机眼里看到的无非就是01010的数字,没有任何区别,AI飞行员甚至都不知道自己打赢的比赛是什么玩意儿,对人类多重要。而真实世界虽然也可以数字化,但远非计算机的数字化复杂度可比,前文提到,当前的AI系统存在单一任务能力强,多任务能力弱;数据支撑需求高,弱训练场景 泛化能力弱;图像、语音处理能力强,决策能力弱;模拟环境能力作用强,实战环境能力作用弱的的问题,也正是这四个问题阻止了AI入侵真实世界。
首先来看单一任务能力强,多任务能力弱。目前的AI系统想要掌握多个技能非常困难,一个辛辛苦苦训练出来的AI系统应用范围十分狭窄,想要实现多个功能决策,就需要构建多个AI系统,而在真实世界中,飞行员驾驶飞机作战远不是做几个机动动作那么简单,需要同时掌握航电操作、武器系统操作、飞行系统操作、仪表读取、目标识别、故障系统读取和操作等数十种技能,而这些技能无法通过一种AI系统来实现,如果构建多个AI系统,那对算力的要求就会呈爆炸式上升,以至于机载电源无法承受的地步。
再来看数据支撑需求高,弱训练场景泛化能力弱。我们看到无论是阿尔法还是阿尔法狗,它的成功背后都是有数百万几千万的数据在支撑,这种数据大多数是机器自动标注的, 标注的方式则是强化学习的奖励函数,而对于真实世界而言,这种量级的数据获取本身就不太可能,更别说让机器自动去标注了,而对于真实世界这种小样本的学习,目前的AI技术仍然毫无办法。此外,即便是某些特定领域有大量的数据喂食AI系统,AI系统泛化能力差的毛病却一直没有得到改观,只要脱离了固有的训练场景,一个本来工作好好的AI系统立马变得频频出错,这一点和人类实在无法比,我们看到无数搞无人驾驶的公司,其自动驾驶系统在晴天时工作良好,在雨天工作就拉胯,在熟悉环境驾驶畅行无阻,到陌生环境就鬼使神差的做出奇怪动作。
第三来看图像、语音处理能力强,决策能力弱。这一点似乎和阿尔法空战5:0的情况不是很符合,但其实这里所说的决策能力是真正基于因果推理的决策能力,而不的基于AI的统计推断,举个例子来说,AI在长期观察到一个人下雨天上班的视频后,就会天然认为,是这个人上班导致了下雨,或者下雨导致了上班,而不会去关心着其中的逻辑关系,也就是说"它没有常识,也没有逻辑",而在现实生活中,由于我们的世界随机性太强,所以大多数人依靠的是常识和逻辑来判断,统计推断属于辅助,所以导致深度学习算法在现实世界中的决策出现格格不入的情况。
第四来看模拟环境能力作用强,实战环境能力作用弱的问题,之前我们说,真实世界的数字化要比数字化的真实世界难的多,我们虽然看到阿尔法在数字世界战胜了人类飞行员,但是我们却不知道,现在的AI图像处理技术想要实现雷达信号的自动处理和识别都很难,几乎没有找到成功的案例,原因在于,真实世界里的雷达信号是非常复杂的,杂波形式多样,特征各异,想要找到一个合适的函数来拟合不但需要大量的有标签样本训练,还要这一系统具备强大的泛化能力,如果有所建的机器学习模型或者是深度学习模型在训练样本中表现得过于优越,有可能导致在验证数据集以及测试数据集中表现不佳。举个通俗点的例子就是会有过拟合和欠拟合的情况,给机器识别学习记忆狗的相关数据,我们拿二哈给它学习,机器学的非常好,记住了二哈所有影像和特点,然而,给它个金毛让他识别,它就判定金毛不是狗。那连二哈记得都不好就是欠拟合,如果需要把空战相关的各个装备、人员和指挥流程都用AI建模,则基本上属于不可能完成的任务。
其实,在AI方面,我们真的不用去担心美国忽然出现一个什么黑科技AI秒杀世界,因为AI工程实现必然是远远落后于科学研究,AI相关的论文和最前沿的科学研究任何人都能接触到,它现在到底发展到了什么程度科学家都十分清楚,它哪些事情能做到哪些不能做到,弱点在哪里行业专家也是了然于胸,旁观者大惊小怪只是因为对这行不太懂罢了。