大模型时代,自动驾驶落地还需几步?
作为一家顺应潮流的车企,在大车型时代自然不能落后:7月31日,吉利公布了大车型的技术。8月8日,广汽发布了“广汽AI大模型平台”。奇瑞也将发布自己的大型人工智能车型...在此之前,小鹏、Ideal、特斯拉都宣称拥有“自动化数据闭环系统”作为大车型的应用方向。
另外,平台级的公司,百度、阿里、腾讯、360,还有华为都推出了自己的大规模机型。上半年末,国产大型车型达80余辆。中国和美国的大型车型数量占全球的80%。在大型车型如此火爆的今天,自主驾驶的实施也在加快。当然,也迎来了新的挑战。
01自动驾驶中的大型车型
事实上,一个“模型”是一个计算机程序,用来建立一个虚拟的神经网络。类似于生物神经网络,神经只有受到一定程度的刺激才会活跃起来。如果刺激得到加强,活动就是输出。这实际上是一个多段函数的表达式。神经网络可以模拟任何连续函数。从上世纪80年代开始,这些计算机概念陆续建立并应用于自动驾驶,但一直没有大的突破。
根本原因在于参数的多少。这是ChatGPT流行的一个重要原因。OpenAI发现,如果模型参数的数量达到一定水平,系统的智能性(模型准确性)将大大提高。原理现在无法解释,但已经有一个词可以形容——“涌现”。到什么程度。一般来说,至少有1亿左右。当然,由于自然语言的信息密度高于图像,所以ChatGPT-2的参数数达到了15亿,而ChatGPT-3的参数数达到了1750亿,和人类神经元的数目差不多。
自动驾驶中的大模型更为复杂,被称为多模态大模型。作为一个可以处理很多不同类型数据的深度学习模型,它可以整合来自不同传感器的数据,并根据这些数据做出决策。多模态大模型通常由多个分支组成,每个分支处理不同类型的数据,如图像、文本、声音、视频等。这些分支可以并行运行,最终将结果合并用于决策。与传统的单峰模型相比,多峰大模型的优势在于可以从多个数据源获得更丰富的信息,从而提高模型的性能和鲁棒性。例如,在自动驾驶领域,多模态大模型可以同时处理来自摄像头、激光雷达、毫米波雷达等多个传感器的数据,更全面地了解当前的交通环境,做出更准确的决策。
02大型车型如何颠覆自动驾驶
具体来说,如何在自动驾驶汽车上部署大模型,哪些模块可以部署在自动驾驶汽车上。
首先是自动驾驶的感知部分。众所周知,自动驾驶的感知需要融合多个传感器的输入,完成数据的融合和增强。这个过程中,当传感器的检测结果发生冲突时,哪一方的结果更值得信任就成了一个大问题。大型模型的一个很大的优点就是可以处理不同类型数据之间的关系。比如在自动驾驶中,摄像头可以提供道路和障碍物的图像信息,激光雷达可以提供距离和深度信息,毫米波雷达可以提供速度和方向信息。大模型可以将这些不同类型的数据融合在一起,更全面、更准确地了解驾驶环境。
二是完成目标检测任务中的自动标注和预标注。过去有监督学习(人工训练),但现在要让人工智能进行自我训练,必须先完成数据闭环。这就是为什么几个新的力量说他们有一个“自动数据标签系统”,这实际上是大模型的一个功能。完整的数据闭环包括数据采集、数据返回、数据处理、数据标注、模型训练、测试验证等诸多环节。其中,“数据标签”是人工智能自我训练的前提,也是人工智能训练的成本节点。
所谓标注,就是对视频或图像的关键信息点进行标注,以便系统在实际运行中能够理解并做出有针对性的规划。显然,量产车收集的场景基本上都是重复的,数据意义不大。专用采集车价格较贵(每天花费6000—10000元)。关键的一点是如何尽可能多地收集“长尾场景”,也就是不常遇到但几乎每个人开车多次后都会遇到的场景(约占5%)。在大模型上线之前,它是手动标记的。对于1000帧的视频数据,人工标注的费用可能会达到1万元。大模型目前最有价值的部分是自动数据标注,可能会节省上亿元(取决于有多少人更换数据标注)。
03大模型时代,车企迎来全新挑战
在大模型时代,由于模型参数量的巨大,所采集的数据也在飞速增长,如何应用好车企赖以生存的驾驶数据,并通过分布式系统来进行部署和训练,最终如何应用在自动驾驶车辆上,都成了一大难题。
一般来说,数据闭环的工作现在已经分割给外包供应商、大模型平台公司(也可以视为供应商)和车企分别来做。很少有车企能够彻头彻尾地自己部署基础大模型,自己搞定应用层,自己设计预标注并实现数据闭环,再驱动算法更新。这即是L4的进化之路,它的技术复杂度要求车企与供应商充分融合式合作,而非传统的供应商“交付”-主机厂应用。
车企过于看重价值链全盘掌握,强调全栈自研,可能会耽误迭代进程。如果设计一种规则,比如基础层大模型由平台级公司设计,车企负责掌握标注规则,并将后续人工审核交给另外的第三方,拿回标注好的数据之后,自己进行训练。通过任务拆解,让自己处于自动驾驶价值链的核心地位。避免在关键技术上受制于人,也不用被迫接受由某个供应商提出软硬一体的解决方案。
总而言之,大模型的兴起又引起了掌握智能驾驶的新势力的一场狂欢,作为笔者始终认为想要在L4级别的自动驾驶领域走到最后,必须是智驾、车身一起抓,特斯拉已经为后来者指明了方向,在大模型时代到来之际,也将拉开新势力与传统造车厂的进一步差距。
来源:网络
版权归原作者所有,如有侵权,请联系删除