大模型时代，自动驾驶落地还需几步？

作者：鸿飞达

发布于： 2023-08-31 00:00

分类：行业新闻

作为一家顺应潮流的车企，在大车型时代自然不能落后：7月31日，吉利公布了大车型的技术。8月8日，广汽发布了“广汽AI大模型平台”。奇瑞也将发布自己的大型人工智能车型...在此之前，小鹏、Ideal、特斯拉都宣称拥有“自动化数据闭环系统”作为大车型的应用方向。
另外，平台级的公司，百度、阿里、腾讯、360，还有华为都推出了自己的大规模机型。上半年末，国产大型车型达80余辆。中国和美国的大型车型数量占全球的80%。在大型车型如此火爆的今天，自主驾驶的实施也在加快。当然，也迎来了新的挑战。
01自动驾驶中的大型车型
事实上，一个“模型”是一个计算机程序，用来建立一个虚拟的神经网络。类似于生物神经网络，神经只有受到一定程度的刺激才会活跃起来。如果刺激得到加强，活动就是输出。这实际上是一个多段函数的表达式。神经网络可以模拟任何连续函数。从上世纪80年代开始，这些计算机概念陆续建立并应用于自动驾驶，但一直没有大的突破。
根本原因在于参数的多少。这是ChatGPT流行的一个重要原因。OpenAI发现，如果模型参数的数量达到一定水平，系统的智能性（模型准确性）将大大提高。原理现在无法解释，但已经有一个词可以形容——“涌现”。到什么程度。一般来说，至少有1亿左右。当然，由于自然语言的信息密度高于图像，所以ChatGPT-2的参数数达到了15亿，而ChatGPT-3的参数数达到了1750亿，和人类神经元的数目差不多。
自动驾驶中的大模型更为复杂，被称为多模态大模型。作为一个可以处理很多不同类型数据的深度学习模型，它可以整合来自不同传感器的数据，并根据这些数据做出决策。多模态大模型通常由多个分支组成，每个分支处理不同类型的数据，如图像、文本、声音、视频等。这些分支可以并行运行，最终将结果合并用于决策。与传统的单峰模型相比，多峰大模型的优势在于可以从多个数据源获得更丰富的信息，从而提高模型的性能和鲁棒性。例如，在自动驾驶领域，多模态大模型可以同时处理来自摄像头、激光雷达、毫米波雷达等多个传感器的数据，更全面地了解当前的交通环境，做出更准确的决策。
02大型车型如何颠覆自动驾驶
具体来说，如何在自动驾驶汽车上部署大模型，哪些模块可以部署在自动驾驶汽车上。
首先是自动驾驶的感知部分。众所周知，自动驾驶的感知需要融合多个传感器的输入，完成数据的融合和增强。这个过程中，当传感器的检测结果发生冲突时，哪一方的结果更值得信任就成了一个大问题。大型模型的一个很大的优点就是可以处理不同类型数据之间的关系。比如在自动驾驶中，摄像头可以提供道路和障碍物的图像信息，激光雷达可以提供距离和深度信息，毫米波雷达可以提供速度和方向信息。大模型可以将这些不同类型的数据融合在一起，更全面、更准确地了解驾驶环境。
二是完成目标检测任务中的自动标注和预标注。过去有监督学习（人工训练），但现在要让人工智能进行自我训练，必须先完成数据闭环。这就是为什么几个新的力量说他们有一个“自动数据标签系统”，这实际上是大模型的一个功能。完整的数据闭环包括数据采集、数据返回、数据处理、数据标注、模型训练、测试验证等诸多环节。其中，“数据标签”是人工智能自我训练的前提，也是人工智能训练的成本节点。
所谓标注，就是对视频或图像的关键信息点进行标注，以便系统在实际运行中能够理解并做出有针对性的规划。显然，量产车收集的场景基本上都是重复的，数据意义不大。专用采集车价格较贵（每天花费6000—10000元）。关键的一点是如何尽可能多地收集“长尾场景”，也就是不常遇到但几乎每个人开车多次后都会遇到的场景（约占5%）。在大模型上线之前，它是手动标记的。对于1000帧的视频数据，人工标注的费用可能会达到1万元。大模型目前最有价值的部分是自动数据标注，可能会节省上亿元（取决于有多少人更换数据标注）。
03大模型时代，车企迎来全新挑战
在大模型时代，由于模型参数量的巨大，所采集的数据也在飞速增长，如何应用好车企赖以生存的驾驶数据，并通过分布式系统来进行部署和训练，最终如何应用在自动驾驶车辆上，都成了一大难题。
一般来说，数据闭环的工作现在已经分割给外包供应商、大模型平台公司(也可以视为供应商)和车企分别来做。很少有车企能够彻头彻尾地自己部署基础大模型，自己搞定应用层，自己设计预标注并实现数据闭环，再驱动算法更新。这即是L4的进化之路，它的技术复杂度要求车企与供应商充分融合式合作，而非传统的供应商“交付”-主机厂应用。
车企过于看重价值链全盘掌握，强调全栈自研，可能会耽误迭代进程。如果设计一种规则，比如基础层大模型由平台级公司设计，车企负责掌握标注规则，并将后续人工审核交给另外的第三方，拿回标注好的数据之后，自己进行训练。通过任务拆解，让自己处于自动驾驶价值链的核心地位。避免在关键技术上受制于人，也不用被迫接受由某个供应商提出软硬一体的解决方案。
总而言之，大模型的兴起又引起了掌握智能驾驶的新势力的一场狂欢，作为笔者始终认为想要在L4级别的自动驾驶领域走到最后，必须是智驾、车身一起抓，特斯拉已经为后来者指明了方向，在大模型时代到来之际，也将拉开新势力与传统造车厂的进一步差距。

来源：网络
版权归原作者所有，如有侵权，请联系删除