在自动驾驶的路上,特斯拉走得比谁都激进。
10月20日,特斯拉向部分车主推送了FSD(Full Self-Driving)的最新版本FSD Beta,按照马斯克的说法,这次更新将为特斯拉实现“零干预的”、“完全意义上的”自动驾驶功能。
早在今年6月,马斯克就曾公开宣布,特斯拉的FSD将会迎来一次质变更新,FSD Beta是一次基本架构的重写,而不是一次渐进式的代码调整。重写的算法,能够将FSD的感知能力从2D拓展到4D,增了深度预测(Birdview映射网络)、时间预测(RNN处理遮挡)等功能,这不仅意味着车辆能够更清楚地感知真实世界,还能够对位置、方向及速度做出更加精准的预判。
这个版本之前,基于FSD实现的Autopilot辅助驾驶,启用前须满足一些基本条件,包括清楚识别车道线、识别前方车辆、时速在30英里以上等等,但是在FSD Beta中,启用条件大大降低,简单到只需在导航中设定目的地就可以激活功能。
从一些早鸟用户分享的视频来看,FSD Beta可以实现复杂的环岛路况识别、不依赖车道线的自主行驶、自主超车(或是绕过干扰物)、路口红绿灯识别、适时左转,以及应对各种天气状况的能力,包括夜晚、雨天等。
要知道,光是“不依赖车道线的自主行驶”这一点,就足以打败市面90%的竞争对手了。
质变的FSD Beta
接下来,我们就看看FSD Beta究竟有什么亮点。
因为该版本目前只推送给了美国本土的部分用户(专业用户或媒体),所以文章中的素材与资料大多来自美国早鸟用户的分享。
从网路流出的路试视频中可以发现,FSD Beta重新设计了UI界面,可根据白天或夜晚的光照环境做出不同的显示,屏幕左侧1/3为车辆状态区,右侧为导航地图,车辆模型也从区域下方提升至区域中部。
左侧区域显示了道路标线、交通标识、路口构造以及车道两旁的汽车等元素,且用不同颜色的线条做了标识,可根据车辆的行驶状态即时显示信息,仿佛是在演示“FSD眼中的世界”。与此同时,可视化模型从之前的2D改进成4D,视角也从车内第一视角改为车后方的第三视角。
总得来说,显示的信息量比之前更加丰富、更加细致,看起来科技感也更强了。不过相对于之前的版本,这次FSD Beta的UI设计有点简陋,似乎是面向工程师的版本,相当硬核。并且,过多的信息显示可能会吸引驾驶者的注意力,所以在之后的正式版本估计会有所调整。
现在的FSD Beta能实现什么功能?
我们继续来看:
(1)识别交通信号灯
车辆前方的摄像头能够准确识别路口的红绿灯,并以此决定车辆的行进。这一功能此前在美国部分地区可以使用,如今全面开放:
同时,夜晚对交通信号的识别也非常准确:
(2)识别停止标识
在美国的交通规则中,STOP标识表示车辆需要停车、进行3秒左右的观察,然后才继续行进,通常见于路口,FSD Beta也能良好识别并配合操作:
(3)十字路口判断
经过十字路口时,如果要进行右转,FSD Beta可以判断左向或对向是否有来车,然后再继续行进:
(4)自动通过环岛
最令人吃惊的一点,FSD Beta现在能够主动通过环岛,并在过程中判断附近车道是否有来车,根据导航决定驶出的车道:
即使是夜间行驶也完全Hold住:
(5)更加智能的召唤
FSD Beta增强了召唤功能的应用场景,可以根据停车场的实际路况判断行车轨迹,做到区域内的完全无人驾驶:
(6)主动避让非机动车
在狭窄的路段,如果识别到路边有非机动车行驶,FSD Beta会轻微向另一侧进行避让:
甚至能够准确地面的障碍物,并进行规避:
(7)鬼探头预警
“鬼探头”是指在视野盲区突然冲出来的行人或障碍物,往往超出人类司机的反应,来不及避让。而FSD Beta如今具备遮挡预测,可以及时发现并制动:
除了上述几种,FSD Beta的新功能还有很多,这里不能一一枚举,感觉意犹未尽的朋友可以去搜一搜实车演示视频。
如何实现这些功能?
全新的FSD Beta确实如马斯克所说,实现了技术上的飞越。那么,这些功能具体是怎么实现的呢?
四个字简单概括:硬件+算法。
特斯拉的FSD硬件出厂即搭载,没有后续升级,我们以最新的Model 3车型为例:
Model 3拥有8颗摄像头,其中3颗摄像头负责前方视野,剩下5颗摄像头则负责监控车辆侧面和后方。
在最新的FSD Beta中,这8颗摄像头采集的画面将构成一张影像,而不是每个摄像头独立工作、独立分析。这是一个非常大的提高与改进。
这里插一嘴,为什么是摄像头而不是激光雷达方案?因为马斯克曾经多次强调,特斯拉的目标是实现一个可以在更大范围和道路场景下使用的自动驾驶系统,而不是像Waymo一样,虽然传感器武装到牙齿,但是只能在制定区域内行驶。而摄像头的低成本特性,才能够支撑这个方案。
说回传感器,Model 3还整合了处理能力增强版的1颗前视雷达,为车辆提供额外的环境数据,同时在雨雾、砂尘等天气充当安全冗余。此外还有12颗超声波传感器,虽然工作半径较短,不过它们能在任何速度下稳定工作,主要是针对车辆控制盲区时使用。
除了传感器方面的支持,Hardware 3.0还有一颗心脏——FSD芯片。它用上了两块自研SoC,两块GPU,两块神经网络处理器和一块锁步CPU。为了提升神经网络处理器的存取速度以提升计算能力,每颗FSD芯片内部还集成了32MB高速缓存。从特斯拉官方公布的数据来看,Autopilot HW 3.0能够处理来自8路摄像头同时工作产生的每秒2300帧图像,总算力达到了144TOPS。
在硬件基础不变的情况下,实现功能上的迭代更新,关键就在于特斯拉的算法。但是算法是FSD Beta的核心技术也是特斯拉的机密,这里无法展开。我们只能从马斯克透露的信息中,捕捉一些重点。
在去年的Autonomy Day上,马斯克透露,特斯拉内部拥有一个代号为『Dojo』的超级计算机项目。从马斯克的描述来看,Dojo是特斯拉继FSD芯片后的又一大杀器,它能够以FP32进行1 Exaflops计算。FP32是浮点数,比使用16位的FP16更加精准;Exaflop指的是计算机每秒可以处理多少浮点运算,1 Exaflop意味着每秒百亿亿次,与之对比的是目前世界上最强的超级计算机则是0.415 Exaflop的速度。
这套超级计算机,可以输入海量来自车辆上传的视频数据,创建巨大的数据库,从而构建出驾驶模型,并通过训练服务器进行无监督的算法练习。这些数据包括车道标识、交通路况、障碍物、交通标志等,系统将会对这些视频进行筛选、清洗、标注,同时还有几百名熟练的标记工程师同步处理,以此来达到高度准确的机器学习。
想必,这些就是FSD Beta能够对堆栈进行根本性的重写的关键。
也因为有这样的技术支撑,马斯克在2020年的世界人工智能大会上夸下海口,他表示特斯拉已经非常接近L5级自动驾驶了,将会通过现有的硬件和不断改进的软件最终实现L5级自动驾驶。
部分技术疑点
然而,虽然FSD Beta的实测功能惊为天人,还是有不少极客粉丝发现了问题,其中最大的争议就是FSD Beta是否使用高精地图。
按照特斯拉的说法,Autopilot是基于纯视觉算法实现自动(辅助)驾驶的,与业界常用的激光雷达路线截然不同。马斯克也对自家的视觉技术有绝对的信心,一直坚持100%的视觉识别,甚至放言“基于GPS的高精度地图是个糟糕的主意,这会让整套系统变得脆弱”。
然而,有一位博主在社交媒体上质疑,特斯拉或许采用了“高精度地图”,例证就是下图,实际道路中远侧的左转路口可视程度非常低,但是FSD Beta却清晰地显示出了路口的画面:
所以有人猜测,FSD Beta预加载了道路信息,并不是真正的视觉识别驾驶。
但是还有另一个说法,FSD Beta采用的是SLAM建图方式。SLAM,即Simultaneous Localization and Mapping,主要用于解决人工智能在未知环境运动时的定位与地图构建问题,最早在1989年由NASA提出。
此推测的根据是,FSD Beta在采集巨大的用户反馈数据,推特另一位博主表示:"在收到FSD Beta更新的短短两天内,他的Model 3就上传了21.09GB的数据",其中或许包括海量的道路信息。
目前特斯拉官方并没有回应这些质疑,这个问题皆电以后也还会跟进。
特斯拉领先了多少
近年来,神经网络与视觉学习的技术飞速发展,少不了特斯拉做出的巨大贡献。从上述FSD Beta功能的详解来看,特斯拉在自动驾驶领域不仅走得很激进,技术也确实够硬。如果不出意外,特斯拉还将继续扩大优势。
为什么?
目前在自动驾驶领域发力的,主要有三类势力,一个是互联网科技巨头、一个是新能源车企、还有一个是强调智能化转型的传统车企。
自动驾驶系统,说到底是依靠人工智能来实现的,而人工智能需要大量的数据来作为“养料”进化。正因为如此,对于自动驾驶技术来说,不仅要掌握自动驾驶的软硬件整合,还需要大量的数据供人工智能进行深度学习。
从这一点来看,特斯拉拥有绝对的优势。Google的Waymo虽然有算法,但是缺乏真实的用户数据;通用的Cruise也有同样的问题,数据体量远远小于特斯拉;传统车企更别说了,算法还没有一家能够匹敌前两者。而特斯拉这边,光是Model 3这一款车,1年就可以卖近30万辆,且大部分都搭载影子模式。
所谓影子模式,就是指当Autopilot处于开启状态时,系统会在后台探测车辆行驶道路周围的数据,并学习人类驾驶员的驾驶操作,最后将数据传回服务器进行建模运算,从而优化驾驶算法再OTA给车辆。自2015年特斯拉开始在车上搭载Autopilot以来,影子模式已经后台行驶超过30亿英里。这个规模,是其它在封闭路段进行测试的自动驾驶系统都难以企及的。
我们离无人驾驶还有多远?
分析到这里,应该有不少人觉得我们是不是快要实现无人驾驶了?对不起,这里还是要泼一盆冷水。纵使我们理论上一直在进步,但是距离完全体的无人驾驶恐怕还有很长一段距离。
首先,从技术上来看,技术的边角案例(Corner Case)还无法有效解决。自动驾驶系统中,车辆通过雷达或摄像头采集数据,上传后供机器进行学习,但是实际行驶中,难免出现一些超出机器的经验范围的路况,这些就是边角案例(如台湾Model 3冲撞翻倒货车的例子)。
电动汽车百人会的研究报告指出,如今的无人驾驶技术可处理90%的常规路况,但剩下的10%边角案例影响巨大,需要花费90%的时间解决。
特斯拉也明白这一点,所以也给FSD Beta的使用者一些提示:首先它只推送给部分专业用户,说明这套系统能否全面开放还存在不定因素;其次,特斯拉在更新说明中也提到,FSD Beta仅为一个测试版,使用时需要额外留心。它有可能在最危险的时候做出错误选择,所以驾驶员必须保持双手握住方向盘,并持续观测路面的交通状态。
除了技术层面,其它问题还包括但不限于:
法律上的责任归属。责任主体在任何法律中,都是一个至关重要的概念。但是自动驾驶技术,模糊了这个概念的划分。如果处于自动驾驶的车辆不幸发生车祸,责任在于驾驶员?在于技术供应商?还是在于车辆所属品牌?这都是目前都是没有解决的问题(如美国Uber致行人死亡的例子)。
路权与道路规则的制定。无人驾驶车辆是否和人工驾驶车辆享有同等路权、接受统一管理?它们是否行驶在同样的车道、应用同样的交通规则?
产品性质的变化。自动驾驶将大幅提高车辆的使用率,从而降低了整个道路的车辆存量,因为此时人不再需要车辆的所属权,只需要拥有车辆的使用权,产品本质的转变,消费者是否能够接受?
譬如说技术上的伦理。著名的电车难题又会重现,假设一辆自动驾驶的车辆,面对前方路边突然冲出的行人,可进行躲避从而保护行人,但是会牺牲乘客和道路其它车辆的安全,反之则会伤害行人,AI该如何进行判断选择?
自动驾驶要面临的问题还有很多,这里不能一一枚举。也因为如此,致力于自动驾驶技术的企业不能操之过急,将一些还未实现的功能点前置宣传,容易造成公众们的误解,甚至引发重大的安全事故。
汽车供应商大陆在2013年做过一项关于自动驾驶调查,结果显示,66%的美国人认为“自动驾驶汽车让我感到害怕”,50%的人认为“该技术无法可靠运行”。而到了2018年,两项调查结果的数据却增加到了77%。原因可能是特斯拉、Uber等公司在自动驾驶测试中一次又一次的交通事故,影响了公众对于自动驾驶的信心。
自动驾驶的最终形态
现在我们理解自动驾驶,就是将车辆的操控权“由人交给车”,但笔者认为,应该将车辆的操控权“由人交给路”。
假设未来某一天,全民自动驾驶成真,那公路上行驶的车辆必定会采用来自不同公司的自动驾驶解决方案,技术上恐将良莠不齐、判断标准也千人千面。况且,即使单车的自动驾驶无论多么强悍,也无法预测公路上其它车辆的行动,必定会存在意外之外的难题。
而真正实现完全无人驾驶的方法,是将整个城市交通融为一个交通网络,路上的每一台车通过5G和物联网技术接入到这个大网络中,由人工智能中心进行协调运作,每一台车都知道自己在系统中的相对位置和将要行驶的路线,从而实现最高效的运输效率、最大化的道路容量利用,届时,人只需要选择起点和终点,系统就会自动分配车辆给你,行驶至目的地。
当然,这或许只是一个不切实际的幻想,不过以特斯拉为代表的科技巨头,或许真的能够让我们离科幻电影更近一步。
(图/文/摄:皆电 唐科)