纯视觉自动驾驶很香但不妨碍马斯克拥抱激光雷达
【智能车牌回顾】北京时间8月20日,特斯拉召开年度艾岱发布会。会上,特斯拉展示了一个完全基于摄像头的自动驾驶方案。
在我们大多数人的认知中,激光雷达是实现高级别自动驾驶的必要条件,马斯克就是著名的反激光雷达者。他不止一次在公开场合批评激光雷达是垃圾,是“多余的傻瓜”行为。但问题是。高水平的自动驾驶系统真的只能靠摄像头搭建吗?
为什么纯视觉自动驾驶方案精彩?
简单来说,相机相当于人眼,只提供成像功能。人眼很难判断物体的准确速度和距离。但如果是雷达,可以通过发射无线电波或激光来接收反射信号,这样可以更准确地接收周围的环境信息。此外,在一些特定的情况下,比如雨雪、进出隧道、深夜没有路灯,雷达比摄像头更可靠。
基于这个逻辑,大多数汽车厂商和自动驾驶技术供应商都把雷达之王——激光雷达作为自动驾驶的核心部件。
自动驾驶的三个基本要素是感知-决策-控制。感知是指硬件捕捉路面的信息,相当于人的眼睛、鼻子和耳朵;决策就是对捕捉到的信息进行分析并做出相应的动作,相当于人的大脑;而控制就是执行决策,这就相当于人类的四肢完成了动作。其中,对于自动驾驶来说,最重要的是感知水平。一旦感知错误,捕捉到错误的信息,就会做出后续错误的判断和决策,最终造成不可预知的危险。对于大多数厂商来说,光是摄像头捕捉到的信息错误率就令人发指,这也是为什么没有人愿意开发纯视觉自动驾驶的原因。
马斯克为什么坚持视觉算法?
为什么大家都在追激光雷达,马斯克却坚持走相机路线?主要原因是成本。目前,特斯拉Model 3的自动驾驶摄像头售价仅为65美元左右。但在很长一段时间内,一套便宜的激光雷达将花费数千美元,这与马斯克人人买得起特斯拉的野心背道而驰。
另一个原因是马斯克的思维方式与常人不同。当所有人都认为相机有不可避免的缺点时,马斯克坚信相机和人眼的想法是一样的,人眼能做到的也可以通过强大的算法来实现。出于成本考虑和略显偏执的思维,特斯拉投入巨资研发纯视觉自动驾驶系统。
如今特斯拉的纯视觉自动驾驶有什么发展?
马斯克的目标是让相机的处理能力达到激光雷达的水平。激光雷达的工作原理是通过各个激光点的反馈实时恢复环境状态。特斯拉需要做的是通过强大的算法检测相机每个像素的深度,分析2D图像的每个像素,模拟3D效果。
似乎每个人都能理解这个原理,但要实现这个简单的原理,需要付出很大的代价。因为它精确到像素。
级,这对车辆的运算能力提出了更高的要求。由于需要极为强大的算法支持,在人工智能日上,特斯拉还发布了自研芯片D1。单颗 D1 拥有 500 亿个晶体管、362 TFLOPS 的峰值算力(BF16/CFP8),功耗不超过 400W。这套顶级的车载芯片,想必成本不会太低。要知道,目前华为已经宣布将车规级别的激光雷达成本压缩至200美金,特斯拉为纯视觉自动驾驶付出的代价,或许短时间内分摊到量产车上都是个天文数字。从这里也能看出来,马斯克的野心从来不是短期的利益,而是规划的足够长远。一套全新的顶级芯片,或许短期看仅仅是为了辅助驾驶的投资,而未来获得的收益或许远不止于此。得益于超强的芯片表现,特斯拉未来在车机系统和动力表现上,有望带给我们更多惊喜。
在特斯拉公开展示的纯视觉自动驾驶效果图上,在白天已经能很好的模拟出3D效果,然而更多极端场景仍然是特斯拉需要解决的难题,夜间、大光比以及极端天气,这些才是最棘手的难关。
未来的自动驾驶如何实现?
特斯拉,或者说马斯克,将所有人认为的不可能变成了可能,纯视觉自动驾驶系统虽然目前来看依然有很多问题需要解决,但无限接近激光雷达的表现让人震惊。未来通过拥有强大算法的芯片,纯视觉自动驾驶或许会发展到一个超出我们认知的高度。但即便如此,我们认为激光雷达仍然是一个有着重要意义的存在。激光雷达在某种程度上能轻易的解决摄像头的弊端,即便摄像头被赋予了超出认知的表现,仍然不妨碍激光雷达扮演一个安全员的角色。特别是如果激光雷达的成本被压缩的足够低,比如低至200美元以下,我们想不出任何拒绝它的理由。或许著名反激光雷达人士马斯克先生,在不远的未来也会拥抱激光雷达说真香呢?
文章来源:CNMO