大疆车载不依赖激光雷达高精地图做自动驾 - 急性肠炎症状

TUhjnbcbe - 2024/10/5 17:58:00

对「软硬件解耦」理解最通透的，一定是金庸老爷子。

在金庸的武侠世界里，顶级高手都没有神兵利器，甚至都没有武器，大理段氏的六脉神剑，萧峰和洪七公的降龙十八掌，张三丰的太极拳，张无忌的九阳神功尽是如此，连顶级剑法独孤九剑，最高境界也是「无剑式」，讲究无招胜有招。

而拥有倚天剑的灭绝师太、拥有屠龙刀的金毛狮王，甚至那些需要用到武器和固定招式的功法，例如葵发宝典，都只能算是第二梯队。这就是软硬件解耦，内功心法是软件，武器是硬件，只有实现软硬件解耦，才能赤手空拳也可以分分钟教灭绝师太做人。

正因如此，看大疆车载的自动驾驶解决方案时，我脑海里同步的画面是张三丰教张无忌打太极拳。据大疆介绍，它们的自动驾驶方案以计算机视觉算法为主，可以有但并不依靠激光雷达、高精地图、RTK高精定位、V2X信号，甚至不依赖高算力芯片，计算平台都是按主机厂的偏好来做适配，真正意义上做到软硬件解耦，不绑定任何硬件，聚焦软件算法。

获五菱、大众合作的可量产智能驾驶方案

大疆车载团队起步于年，截止年年底，核心研发人员余人，硕博比例87%，拥有智能驾驶及相关领域专利多项。在本届车展上，大疆车载发布了面向高速公路的D和D+智能驾驶方案，面向城市快速路的D80和D80+智能驾驶方案，以及面向泊车场景的P5「APA」、P「APA+」、P「AVP」三种方案。

虽说是针对高速公路和城市快速路，但对于城区等非结构化道路场景，D80系列和D系列还提供了城区辅助驾驶功能，具备自适应巡航、车道保持、AEB主动刹车、寻迹过十字路口等能力。

D80系列相较D系列在于支持的最高车速不同，D系列即能够实现0-km/h速度区间内的智能驾驶。车速越高意味着最远探测距离要更远，因此D系列搭载了万像素的高清双目摄像头，而D80系列搭载的双目摄像头是普通的万像素。

而D80和D80+，以及D和D+的区别，在于安全冗余深度不同，D80和D属于L2级辅助驾驶，而D80+和D+则属于L3级自动驾驶，允许驾驶员脱手脱眼，在系统运行期间获得短暂的休息。为了实现更高等级的安全冗余，D80+和D都标配一套激光雷达以及DMS系统，计算上也对应配备算力更高的芯片。不过据大疆工程师透露，凭借大疆优秀的算法，即便是实现L3级的D+系统，算力需求也不会到夸张的数百TOPS。

P5辅助泊车、P记忆泊车、P自主泊车及智能召唤功能，区别在设计运行区域不同，P5是到达车位后调用，P能实现中/远距离全自主泊车，而P则能够实现中/远距离全自主召唤。

据大疆工程师现场介绍，大疆车载的核心能力在于软件算法，通过双目摄像头，便能准确识别常见物体，并估算与物体之间的距离，实现对环境深度信息的探测。凭借大疆在无人机视觉算法上的积累，大疆的双目摄像头感知系统能实现在线自标定，有效避免因温变、振动等环境因素而引起的基线变化带来的误差，输出稳定可靠的感知信息。

大疆车载公布的一系列智能驾驶方案，最能打动我的在于它核心算法的强大泛化能力。即便不使用激光雷达、高精地图、GNSS和RTK信号、V2X信号，大疆依然能够依靠视觉算法获得场景深度信息，依靠视觉SLAM获得位置信息，实现可靠的智能驾驶方案。这对智能驾驶方案成本下探的想象空间是非常大的，连「人民的五菱」也官宣与大疆车载建立合作，用大疆的方案，推出「年轻人的第一款智能驾驶汽车」。

虽然大疆有自己的激光雷达子公司「Livox」，但大疆车载对激光雷达的态度是，可以不用但也不排斥，甚至就算用也不会绑定带货，不是说用了大疆车载方案就一定要用大疆激光雷达。更关键的是，大疆认为既然视觉就能实现的功能，增加成本使用了激光雷达，那就一定要有「质变」的差异，要从辅助驾驶升级成自动驾驶。D80和D，在搭载激光雷达升级为D80+和D+方案后，便可以支持人机共驾，从辅助驾驶跨步到L3自动驾驶。

这和目前大火的华为ADS有所不同，华为的方案是用L4的功能去做L2的体验，虽然搭载了3激光雷达和TOPS的算力，但驾驶员依然是驾驶主体，驾驶过程中是无法休息的，系统是帮助驾驶员更安全的开车，而不是在特定场景帮助驾驶员开车。

视觉做高阶辅助驾驶靠谱么？

如何实现点到点的自动驾驶辅助呢？这需要汽车能理解并解决三个问题，「我在哪儿」，「我要去哪儿」，「怎么去」，如果不依靠激光雷达、高精地图、高精定位，那最难解决的便是「我在哪儿」的问题。

设想一下，把你打晕之后丢在城市的任意街道上，你该如何知道自己在哪儿？第一步打开地图，查看自己在地图上的定位，你就知道自己哪个街道。第二步放大地图，查看地图上的特征点，例如XX街和XX街的交叉口，街道一侧距离交叉口20米的位置有一家KFC。第三步，抬头看路口在哪儿，KFC在哪儿，对比就能知道自己的精准定位：XX市XX街X侧离XX交叉路口X米。

机器有机器自己的世界，而高精地图就是属于机器的世界，同时高精地图也是现实世界的映射，机器理解自己在高精地图中的位置，也就意味着车辆在现实世界中的位置。使用高精地图的方案，例如小鹏NGP、蔚来NOP，和华为ADS，就是通过车载高精地图以及RTK高精定位信号，知道车辆的车道级定位。华为ADS由于有激光雷达，还可以通过算法比对高精地图中的定位图层，提升定位精度以及定位冗余。

图片来自Momenta视觉高精地图

汽车没有高精地图和高精定位，就如同人在一个没有GPS和手机导航的环境，要通过无源导航知道「我在哪儿」，难度高很多，精度也会降低。首先要训练你，让你对整个城市的道路特征有记忆，变成活地图，你就可以不依靠导航和定位，就能在任意一个位置知道自己在哪儿。大疆想要仅依靠视觉和惯导组合，让车辆独立解决「我在哪儿」的问题，就得让AI和人一样有「记忆」。

目前并不清楚大疆是否，自己用车队采集高速公路、城市快速路的环境信息，补充一个高精地图中定位图层的功能，但车辆一定会靠双目摄像头做视觉SLAM同步建图并存储，形成「记忆」，当下次路过这个位置，就能通过比对，获取自己相对参照物的相对定位，如果参照物有绝对定位信息，那车辆就间接有了较为准确的定位，这本质上可以理解为双目视觉SLAM配合视觉众包高精地图，解决「我在哪儿」的问题。当然这听起来很偏执，有现成的厘米级定位信号干嘛不用呢？其实大疆所谓的不依靠高精定位，其实是想做冗余来补全RTK信号丢失的场景，技术足够强大才能用但又不依赖硬件。

图片来自千寻位置

解决了自己的位置信息，还得理解目的地的定位信息，理解交通指示的意义，理解交通规则，从而实现路线的规划，这些都需要通过深度学习使系统构建对现实世界的认知体系。在没有正式体验前，我们也无法确定大疆的这套算法是否可以达到搭载激光雷达+高精定位的水平，但至少从逻辑和技术上来看，是可以实现的。

写在最后

很多车企在推激光雷达车型时，都在讲激光雷达是冗余，是自动驾驶的必备传感器。但事实上「拿激光雷达做冗余」仅成了宣传的噱头，冗余的意思是，就算没有它你也能搞定，只是你搞不定的时候有替代方案不至于歇菜，现阶段激光雷达不仅不是冗余，还成了实现部分场景部分功能的主力军，顶着备胎的名分干正室的活儿。

从这一点上来看，大疆的智能驾驶方案我是很认可的，激光雷达真正被摆在了冗余的位置。用视觉算法降低自动驾驶对硬件的依赖，大疆选择的路线技术难度很大，但对推动智能驾驶发展很有意义。

不过值得警惕的是，那些看起来越完美的技术方案，背后的泡沫往往是越大的，因为技术落地过程中永远都伴随着妥协与让步，那些不完美或许才是自动驾驶的真面目吧。