/导读/
目前的自动驾驶存在这样一些问题:对数据要求太高,未来传感器的成本很难被接受,海量地图数据没完没了,同时还存在对系统鲁棒性要求很高的安全性问题......这些问题都似乎都难以用目前的AI技术来解决。因此,最近有人在知乎上提问:“自动驾驶什么时候才会凉凉,估计还要多久?”引发了热议。对此,一位计算机工程师
zhzz用充足的论点详细论述了他认为自动驾驶目前所面临的困境,并对这一领域的未来提出了自己的见解与展望,也获得了很多人的认同。本文内容便是这位工程师的回答!能问出这种问题说明是个内行人,目前自动驾驶的难点主要在于感知和决策规划,纯视觉的路线基本上gameover了,虽然以后,算力会越来越大,越来越便宜可以实时跑更复杂的神经网络模型,但是,这些模型,或者视觉这种手段本身就很有局限性,并且,训练成本也高,受环境影响大,造成基本不可能达到商用级别的鲁棒性;而现实道路的复杂性,和真实世界近乎无穷无尽的变化,是很难利用有限的数学模型(神经网络模型)完全拟合出来的。一个典型的场景,红绿灯或者交通标致相对老说是很简单有限的一些图形,但是放在香港,东京那种狭窄的充满花花绿绿广告牌的街道目前来看也很难准确鲁棒的识别出来。当然可以通过一些技术手段,比如锁定搜索区域,借助V2X5g车联网等帮助,但是这已经不是一个纯视觉的问题了;另外,决策规划这一块,我个人感觉这属于深水区了,已知的可能只有google开始触及这个深度。人在驾车的时候,会实时的做出很多决策和预测,很多经验判断,做一些潜意识逻辑思考,目前深度学习也好,传统的方案也好,都没办法做到人类思考,推理,类比,联想的思考能力,举个简单的路上一个风吹上去的塑料袋,或者一大堆飘落的树叶,雷达,或者视觉看来就是一个障碍物,可能要停车或者做紧急避让,但是,人就会认识这个东西,直接开过去,或者,目前经常会遇到的,一个小水洼,或者阴影,视觉可能错误认为是障碍物,当然,这个时候可能雷达告诉你这里能通行,这个时候,你的环境融合建模逻辑怎么写呢?是更相信雷达,还是视觉?是走是停?当然这也涉及感知的问题,你说我感知都认出来了,我就开过去,这个基本是不切实际的,你的决策规划模块很难为每一种特殊场景都去写一个if-else判断,这样的情况在现实中几乎无穷无尽;此外还有,看到路边的小动物是否减速,听到警车或者救护车的警笛是否停车避让,跟渣土车保持距离,甚至车上的乘客有异样,是医院还是派出所等等,难道全部写成if-else判断么?稍微懂点技术,就能马上意识到,上面提到的这些问题目前几乎看不到存在能够良好的,彻底的解决的工程化方法。当然你说,以后我们这些都可以依赖大数据啊,我们可以收集非常非常多的驾驶的经验数据,通过云端大数据来进行判断,这相当于我们拥有一个全世界优秀司机的经验池,自动驾驶汽车完全不必理解这些行为的原因,只需根据场景进行最合理的引用;实际上这也是目前自动驾驶的一个主要发展方向,就是车路协同,可能做自动驾驶的人是现在全世界最渴望5g,云计算早点铺开的一批人,目前纯车端智能遇到的各种瓶颈,我靠智慧的道路去突破,车端智能的局限靠智慧的城市智慧的道路去弥补,比如,目前到处存在的监控摄像头,以及可以畅享的未来可能出现的更加多种多样的布设在道路,城市的传感器,可以帮车辆提前并且更大范围,更加准确的感知周围的环境,通过更加实时的网络将信息发送到车端;路上车辆相互之间可以自组网,互相告知大家自己位置和行驶状态,相互协同,前车为后车分享经验,比如前面可能出现的拥堵,或者避开维修的路段等;数据中心将协调车流,这样像目前过十字路口,环岛等难题也会变得非常简单;当然这是一个非常美好的憧憬;那么你可能也意识到了,要做到这个程度可能比目前最乐观的自动驾驶落地时间还要久远的多,所需要的投入也是天量的,毕竟这意味着,我们几乎要翻新整个城市交通的基础设施,变更整个城市的设计建造思路;中间可能还会遇到目前难以想像的技术和工程难题,全都需要时间和巨大的投入去解决;那么,你说,为什么要搞这么复杂?难道不能让汽车像个街上的小老鼠一样,钻来钻去,见人就躲,见缝插针的行驶么?我确实很认真的思考过这个问题,因为,目前依靠多种雷达的组合,利用目前已知的技术手段,基本上是可以做到检测出车辆周围几乎所有可能构成危险的障碍物的,那么,我只用最简单的逻辑判断,不管是树叶,还是行人,车辆全都无脑躲开,利用算力强大的计算机,做到天下武功为快不破,就想街上逃命的小老鼠一样可以么?当然其中还涉及很多动力学的建模,并非一定是可以躲开所有障碍物,比如,躲开侧面的车,但是由于机动能力的限制可能会撞前面的车或者护栏;事实上这种设计应该是已经存在了,用来躲避潜在的外来撞击,以及不去主动撞击别人。但是无人驾驶上路终究还是需要与其他车辆存在一定的互动,并且这种互动必须是遵循交通规则的,比如,跟车要保持距离和一定速度,转弯让直行,比如不能随意变道,红绿灯,环岛,十字路口通过,都有相应的规则需要遵守;无人驾驶系统的开发者必须去实现这些规则;而具体到规则实现,规则遵守运用,就又回到上面的提出的行为决策的问题了。对应到目前一直的情况,实际上装配有多个激光雷达,毫米波雷达的google和baidu的L4无人驾驶方案是基本上没怎么听说有撞车发生的,但是,经常会表现的很傻,尤其是通过路口的时候,经常有体验者提出反应比较迟钝,或者过于谨慎;(特斯拉的设计非常激进,不用激光雷达,只有一个毫米波和一些摄像头,并且看上去决策规划模块的驾驶策略设计也比较激进,感觉就是上面提到的小老鼠逻辑,所以总是撞);所以,总结下来就是感知能力有限,不具有真正意义上的思考和判断能力;其实这也是目前所有人工智能的局限所在,推荐UCLA朱松纯教授的一篇很火的探讨目前人工智能发展现状的文章给大家参考: