对「软硬件解耦」理解最通透的,一定是金庸老爷子。
在金庸的武侠世界里,顶级高手都没有神兵利器,甚至都没有武器,大理段氏的六脉神剑,萧峰和洪七公的降龙十八掌,张三丰的太极拳,张无忌的九阳神功尽是如此,连顶级剑法独孤九剑,最高境界也是「无剑式」,讲究无招胜有招。
而拥有倚天剑的灭绝师太、拥有屠龙刀的金毛狮王,甚至那些需要用到武器和固定招式的功法,例如葵发宝典,都只能算是第二梯队。这就是软硬件解耦,内功心法是软件,武器是硬件,只有实现软硬件解耦,才能赤手空拳也可以分分钟教灭绝师太做人。
正因如此,看大疆车载的自动驾驶解决方案时,我脑海里同步的画面是张三丰教张无忌打太极拳。据大疆介绍,它们的自动驾驶方案以计算机视觉算法为主,可以有但并不依靠激光雷达、高精地图、RTK高精定位、V2X信号,甚至不依赖高算力芯片,计算平台都是按主机厂的偏好来做适配,真正意义上做到软硬件解耦,不绑定任何硬件,聚焦软件算法。
获五菱、大众合作的可量产智能驾驶方案
大疆车载团队起步于年,截止年年底,核心研发人员余人,硕博比例87%,拥有智能驾驶及相关领域专利多项。在本届车展上,大疆车载发布了面向高速公路的D和D+智能驾驶方案,面向城市快速路的D80和D80+智能驾驶方案,以及面向泊车场景的P5「APA」、P「APA+」、P「AVP」三种方案。
虽说是针对高速公路和城市快速路,但对于城区等非结构化道路场景,D80系列和D系列还提供了城区辅助驾驶功能,具备自适应巡航、车道保持、AEB主动刹车、寻迹过十字路口等能力。
D80系列相较D系列在于支持的最高车速不同,D系列即能够实现0-km/h速度区间内的智能驾驶。车速越高意味着最远探测距离要更远,因此D系列搭载了万像素的高清双目摄像头,而D80系列搭载的双目摄像头是普通的万像素。
而D80和D80+,以及D和D+的区别,在于安全冗余深度不同,D80和D属于L2级辅助驾驶,而D80+和D+则属于L3级自动驾驶,允许驾驶员脱手脱眼,在系统运行期间获得短暂的休息。为了实现更高等级的安全冗余,D80+和D都标配一套激光雷达以及DMS系统,计算上也对应配备算力更高的芯片。不过据大疆工程师透露,凭借大疆优秀的算法,即便是实现L3级的D+系统,算力需求也不会到夸张的数百TOPS。
P5辅助泊车、P记忆泊车、P自主泊车及智能召唤功能,区别在设计运行区域不同,P5是到达车位后调用,P能实现中/远距离全自主泊车,而P则能够实现中/远距离全自主召唤。
据大疆工程师现场介绍,大疆车载的核心能力在于软件算法,通过双目摄像头,便能准确识别常见物体,并估算与物体之间的距离,实现对环境深度信息的探测。凭借大疆在无人机视觉算法上的积累,大疆的双目摄像头感知系统能实现在线自标定,有效避免因温变、振动等环境因素而引起的基线变化带来的误差,输出稳定可靠的感知信息。
大疆车载公布的一系列智能驾驶方案,最能打动我的在于它核心算法的强大泛化能力。即便不使用激光雷达、高精地图、GNSS和RTK信号、V2X信号,大疆依然能够依靠视觉算法获得场景深度信息,依靠视觉SLAM获得位置信息,实现可靠的智能驾驶方案。这对智能驾驶方案成本下探的想象空间是非常大的,连「人民的五菱」也官宣与大疆车载建立合作,用大疆的方案,推出「年轻人的第一款智能驾驶汽车」。
虽然大疆有自己的激光雷达子公司「Livox」,但大疆车载对激光雷达的态度是,可以不用但也不排斥,甚至就算用也不会绑定带货,不是说用了大疆车载方案就一定要用大疆激光雷达。更关键的是,大疆认为既然视觉就能实现的功能,增加成本使用了激光雷达,那就一定要有「质变」的差异,要从辅助驾驶升级成自动驾驶。D80和D,在搭载激光雷达升级为D80+和D+方案后,便可以支持人机共驾,从辅助驾驶跨步到L3自动驾驶。
这和目前大火的华为ADS有所不同,华为的方案是用L4的功能去做L2的体验,虽然搭载了3激光雷达和TOPS的算力,但驾驶员依然是驾驶主体,驾驶过程中是无法休息的,系统是帮助驾驶员更安全的开车,而不是在特定场景帮助驾驶员开车。
视觉做高阶辅助驾驶靠谱么?
如何实现点到点的自动驾驶辅助呢?这需要汽车能理解并解决三个问题,「我在哪儿」,「我要去哪儿」,「怎么去」,如果不依靠激光雷达、高精地图、高精定位,那最难解决的便是「我在哪儿」的问题。
设想一下,把你打晕之后丢在城市的任意街道上,你该如何知道自己在哪儿?第一步打开地图,查看自己在地图上的定位,你就知道自己哪个街道。第二步放大地图,查看地图上的特征点,例如XX街和XX街的交叉口,街道一侧距离交叉口20米的位置有一家KFC。第三步,抬头看路口在哪儿,KFC在哪儿,对比就能知道自己的精准定位:XX市XX街X侧离XX交叉路口X米。
机器有机器自己的世界,而高精地图就是属于机器的世界,同时高精地图也是现实世界的映射,机器理解自己在高精地图中的位置,也就意味着车辆在现实世界中的位置。使用高精地图的方案,例如小鹏NGP、蔚来NOP,和华为ADS,就是通过车载高精地图以及RTK高精定位信号,知道车辆的车道级定位。华为ADS由于有激光雷达,还可以通过算法比对高精地图中的定位图层,提升定位精度以及定位冗余。
图片来自Momenta视觉高精地图
汽车没有高精地图和高精定位,就如同人在一个没有GPS和手机导航的环境,要通过无源导航知道「我在哪儿」,难度高很多,精度也会降低。首先要训练你,让你对整个城市的道路特征有记忆,变成活地图,你就可以不依靠导航和定位,就能在任意一个位置知道自己在哪儿。大疆想要仅依靠视觉和惯导组合,让车辆独立解决「我在哪儿」的问题,就得让AI和人一样有「记忆」。
目前并不清楚大疆是否,自己用车队采集高速公路、城市快速路的环境信息,补充一个高精地图中定位图层的功能,但车辆一定会靠双目摄像头做视觉SLAM同步建图并存储,形成「记忆」,当下次路过这个位置,就能通过比对,获取自己相对参照物的相对定位,如果参照物有绝对定位信息,那车辆就间接有了较为准确的定位,这本质上可以理解为双目视觉SLAM配合视觉众包高精地图,解决「我在哪儿」的问题。当然这听起来很偏执,有现成的厘米级定位信号干嘛不用呢?其实大疆所谓的不依靠高精定位,其实是想做冗余来补全RTK信号丢失的场景,技术足够强大才能用但又不依赖硬件。
图片来自千寻位置
解决了自己的位置信息,还得理解目的地的定位信息,理解交通指示的意义,理解交通规则,从而实现路线的规划,这些都需要通过深度学习使系统构建对现实世界的认知体系。在没有正式体验前,我们也无法确定大疆的这套算法是否可以达到搭载激光雷达+高精定位的水平,但至少从逻辑和技术上来看,是可以实现的。
写在最后
很多车企在推激光雷达车型时,都在讲激光雷达是冗余,是自动驾驶的必备传感器。但事实上「拿激光雷达做冗余」仅成了宣传的噱头,冗余的意思是,就算没有它你也能搞定,只是你搞不定的时候有替代方案不至于歇菜,现阶段激光雷达不仅不是冗余,还成了实现部分场景部分功能的主力军,顶着备胎的名分干正室的活儿。
从这一点上来看,大疆的智能驾驶方案我是很认可的,激光雷达真正被摆在了冗余的位置。用视觉算法降低自动驾驶对硬件的依赖,大疆选择的路线技术难度很大,但对推动智能驾驶发展很有意义。
不过值得警惕的是,那些看起来越完美的技术方案,背后的泡沫往往是越大的,因为技术落地过程中永远都伴随着妥协与让步,那些不完美或许才是自动驾驶的真面目吧。