汽车云,自动驾驶的隐秘战场
据何小鹏介绍,「扶摇」是为了处理自动驾驶越来越大的数据量,具备 60 亿亿次浮点运算能力。
在此之前,特斯拉也发布了用于训练神经网络的超级计算机DOJO,浮点运算能力达到了EXAFLOP 级别,即每秒百亿亿次运算,被马斯克称为「如野兽一般」。
一时间,接入云服务成为中美两地各自领域的自动驾驶头部玩家不约而同的选择。然而对于更多的参与者来说,车企为什么要上云、上云可以做什么、应该怎样上云,这些问题的答案尚不清晰,却也亟待得到解答。
正巧此时,由安永(中国)企业咨询有限公司(下简称「安永」)和华为智能汽车解决方案 BU 共同编写的《智能汽车云服务白皮书》发布,里面深入分析了云的数据赋能和业务赋能能力,并根据行业痛点以及企业发展阶段,探讨车企和云服务商应该如何进行合作,助力自动驾驶研发与持续升级。
2022 年,在技术、政策法规接连取得突破后,自动驾驶真正开始从小范围的试验场,走向大规模商业化落地。
现在无论是风头正盛的造车新势力,还是高举高打的 L4 级自动驾驶公司,抑或是正大力转型智能化的传统车企,都在争分夺秒地将自动驾驶功能上车,以期实现量产应用。
与此同时,挑战随之而来。自动驾驶时代,车端数据量指数级上升,由于需要借助激光雷达、摄像头等各种传感器「观察」道路,根据 GARNER 估计,每一部自动驾驶联网车辆每天至少产生4TB数据,而当车企销售出数十万,甚至上百万的自动驾驶车辆时,其数据量将是从PB 级到ZB 级的增长,十分消耗车企在数据获取、存储和计算上的资源。
由于测试车辆规模不大,传统的数据中心足以应对。甚至在一些 ROBOTAXI 公司,仅用最原始的「硬盘拷贝」方式,回传全量数据,然后再进行数据挖掘。
而到了量产阶段,接入的车辆数、产生的数据量大幅提升,训练和并行仿真对 GPU 算力要求陡然增大,传统数据中心难堪重负。
有业内人士透露,公司之前在训练自动驾驶模型的开发阶段时,就经常遇到一些超出本地算力以外的突发性算力需求,结果他们只能走流程采购新的服务器,由于审批流程过长,严重拖累开发进度。
对此,部分车企开始寻求变革。有消息称,某一外资新势力车企已自建超算中心,用来挖掘海量冗余数据,从成本上来说,可谓是投入不菲:仅硬件耗资就高达 1.4 亿美元。
「这显然不是一般车企能够承受的。」一家汽车集团旗下智能科技公司运维总监表示,建设超算中心,硬件只是其中一项支出,如果算上运营维护、价值挖掘等人工花费,成本还要进一步上升。
更重要的是,未来随着数据存储需求的增加,企业势必还要追加投入更多资金,而自动驾驶公司现金流本就十分紧张,难以支撑这一模式。
「上云是自动驾驶从开发到商用的必由之路。」在安永和华为智能汽车解决方案 BU 共同编写《智能汽车云服务白皮书》(以下简称《白皮书》)中,旗帜鲜明地提出了这一观点。
《白皮书》将车企对自动驾驶数据的需求具体划分为四大部分,分别是成本集约、上市效率、可扩展性和安全可靠,并根据车企自动驾驶研发的三个阶段:研发测试期、规模化早期、激烈竞争期,讨论了不同阶段的需求变化趋势。
例如在规模化早期,车企对成本及扩容性需求逐步上升,同时,由于已处于商业化阶段,对于数据安全以及上市效率需求也将提高。而在蓬勃发展的竞争期,市场趋于饱和,车企对成本控制、扩容需求逐渐达到最高点,对于产品更新迭代的需求则逐步下降。
围绕着各阶段需求,汽车云服务都能扮演可受控的「外援」角色,成为车企自动驾驶商业化路上必不可少的拼图。
据了解,基于云服务的方式,通过对多元算力的支持,可满足车企在自动驾驶开发过程中,模型训练和并行仿真对海量基础设施资源极致算力、安全可靠和弹性灵活的业务需求,且相比传统数据中心,可以有效提升 60% 以上的运维运营效率,并降低30~60%的 TCO(总拥有成本)。
更进一步的意义是,随着汽车数据上云,车企将从搭设机房专线、容灾备份、升级扩容,以及运维管理等问题中解脱出来,可以将更多的精力投入到自动驾驶核心算法的开发上。
云服务给车企带来的不只是效率工具的提升,更加速了自动驾驶革命。
一个完整的自动驾驶系统闭环由感知、规划、决策构成,其中感知和规划构成了数据生成的主要部分,包括数据采集、数据清洗、数据标注、仿真测试。
而云服务能做的不仅是海量存储和计算,还融入了智能策略,颠覆以往的数据处理方式。
要知道,自动驾驶系统采集的内容类别繁多,包括视频、图像、激光点云、雷达点云等,除了数据量大,更显著的特点是,价值数据占比低,无关和无价值信息占用了极大存储空间。
针对于此,有云服务商能够提供依靠标签、以图搜图等方式提取难例场景的功能,通过构建高质量数据库与场景集,及时反馈给算法训练,在优化存储空间之余,也加速自动驾驶算法迭代。
「在需要云端主动搜集积累数据进行学习的场景,例如通过隧道、遭遇电动二轮车,可以让开发人员上传需要车辆获取的图片,通过云端下发指令,车端会采取类似『以图搜图』的方式,将类似场景自动截取下来。这样可避免上传整段数据,而只需要把打过标签的『有价值』数据筛选出来上传到云端即可,大大提升了 CORNER CASE 挖掘的效率。」一位汽车云服务商内部人士向汽车之心介绍道。
在挖掘到价值数据后,接下来是对数据进行清洗和标注。简单而言,数据清洗就是擦除车端采集的敏感数据,由于其中包含地理位置、人脸、车牌等涉及国家安全和隐私的信息,必须进行脱敏合规处理,并统一格式,而数据标注则是对清洗后的数据进一步加工,大致分为 2D、3D 目标物标注、联合标注、车道线标注和语义分割等。
无论是数据清洗还是数据标注,都需要大量的人力劳动参与。经过这种方式处理的数据质量质量参差不齐、返工率高,且效率十分低下。即便后来车企慢慢引入本地 AI 训练数据处理,较人工处理提升并不大。
国内某科技龙头公司在标注工作中,就投入了超100 人的团队,发现依靠人工进行标注的工作量占机器学习的比例极高,且耗时耗力,作业效率还难以提高。
这种困扰在自动驾驶企业中并不少见,以至于有人喊出:「在自动驾驶行业内,谁能高效低成本地挖掘数据价值,谁就能成为竞争的王者。」
如果将数据标注的工作交给汽车云服务商,将带来明显的改变。基于云端训练复杂神经网络模型,汽车云服务结合深度学习实现自动标注能力提升,优化标注算法效率与精度,降低数据处理成本。
如果说基于数据的感知过程是铺设地基,那么仿真训练就是房屋的构筑环节,前者决定了自动驾驶技术研发的成败,后者直接影响了整个研发过程的进展。
按照业内的普遍说法,自动驾驶系统要走向成熟,需要至少 100 亿英里的试驾数据。这对于任何车企来说,仅仅依靠实车路测,都是不可能完成的任务,因此仿真测试成为了一条必经之路。
具体来说,场景库包含了虚拟创建的场景以及真实路采的场景,有人将其比作考官出的试题,用来评价仿真软件好坏的标准,而仿真测试平台基于传感器、动力学、交通流等仿真模型的构建,在相应场景中完成仿真测试,相当于是做题的学生角色,而仿真评价可类比为「评分标准」,对测试过程与结果进行评价和反馈,例如是否安全行驶,能否高效到达目的地等。
现实情况下,大多数车企在自动驾驶仿真测试的各个环节都面临挑战:场景库覆盖度不足,行业间格式互不兼容;仿真测试所涉里程数大、场景多,耗时长;仿真测试与实际路测偏差大,置信度低;仿真评价体系不完善,反馈效果差等等。
例如,有车企反映自动驾驶车辆在雨雪天气下刹车通过了仿真测试,然而在实际路测时,却因为摩擦系数变化,导致刹车距离和时间的判断出现了偏差,这就是典型的仿真测试真实性不足。
以上种种都直接影响到仿真效率,某车企研发部门总经理表示,公司每天仅能推进几十到几百公里的测试,进程过于缓慢。
自动驾驶云服务有助于解决这些问题,通过构建全面多样且逼真的仿真场景库、建立全面系统的模型模拟实际车路场景,并通过定制化的多维目标进行仿真评价,以一站式仿真服务实现对自动驾驶车辆在各类复杂场景下的高效仿真测试,既弥补了实车路测的局限性,又提高了开发效率,加速自动驾驶车辆商用落地。
有汽车云服务商向汽车之心透露,其云端大规模并行仿真支持多场景下同时完成多个仿真任务,车辆每日仿真测试里程达到千万公里。
不少车企已经认识到云服务对于自动驾驶的重要性,相应的投入正在快速上升,有数据显示,2020 年,车企在该领域的投入占到整体汽车数字化投入的 60% 以上。
小部分原有 IT 实力较为强劲的车企或新势力以自建云(私有云)为主,仅外采部分针对图形数据的云计算和云存储服务,这种方式有利于车企掌握核心数据以及全流程算法技术能力,打造产品差异化。
不过自建私有云存在成本高、难度大、耗时长的缺点。此外,也难以灵活应对研发过程中,带来的巨量数据存储和波动的高算力需求,如果对私有云进行扩容,则要购买或租借新的硬件和资源,掣肘了自动驾驶迭代开发的速度。
公有云则完美解决了这一问题,不仅能提供强劲的算力,其数据管理能力更是毋庸置疑。这也导致车企近些年纷纷转向公有云。艾媒咨询数据显示,2020 年,公有云规模在 2019 年超过了私有云,成为中国云计算最主要的市场。
某汽车集团信息技术部 VP 表示,公司现在对公有云的采购规模连年大幅增长。「单是云存储这一块,2022 年的预算要比 2021 年增长了差不多 30%,云计算同比也增长了26%。」
需要指出的是,数据管理只是云服务的基础能力,如何利用云深挖数据价值、赋能自动驾驶才是车企的核心诉求。
车企的困难点现在集中到了业务赋能层——用哪些数据、怎么来用、如何安全高效地使用,这需要云在提供资源的基础上输入能力。
某汽车集团 IT 总监对此深表认同,他认为云厂商应该在SAAS层面,给企业提供更轻量化的研发场景,以使自己能专注到最核心的研发上面去。「比如把自动驾驶训练模型都准备好,让企业直接拿来即用。」
这一期待对云服务商提出十分高的要求,意味着后者不仅需要ICT 能力,还要懂汽车,拥有专业的知识储备,并且能做到二者深度融合。
这一点在自动驾驶工具链断点问题上表现得尤为明显。正如上文介绍的,自动驾驶算法研发的关键控制点主要包括数据采集、感知模型训练、仿真测试和实车测试四部分,通过工具链串联,贯穿整个开发核心流程。
一般来说,每个关键控制点的工具链往往都是由不同的供应商提供,即「分段开发」,例如仿真环节就找仿真工具链公司,需要标注就找标注工具链公司合作,这导致车企在自动驾驶研发和迭代过程中,经常遭遇「断点」。
「我们在处理数据传递、算法加载、模型适配的时候,要用到多种工具链,但因为缺少行业规范,这些工具链之间的兼容性十分差,导致我们不得不花大量的时间去适配。」
一位自动驾驶研发工程师举例,公司曾采用各个供应商提供的离散工具链方案,光调试链路,就花了几个月的时间,让整个开发团队苦不堪言。
要解决这一痛点,需要汽车云服务商拥有提供或整合统一工具链的能力,打通上下游链路,帮助车企尽快跑通(数据驱动)PIPELINE。
《白皮书》认为,车企对云服务的需求已经从 IAAS 和 PAAS 层的「资源云」转向 SAAS 层的「能力云」,且不再满足云服务只针对场景中的单一业务,而是希望能纵向延伸至多项业务,解决「数据孤岛」和「业务断层」,单线打透形成体系化输出。
不过也有业内人士对此表示质疑:云服务商如此深层次涉足自动驾驶核心业务,是不是意味着车企把「灵魂」交出去一半?
这种担心正切中部分车企的隐忧。以工具链的使用为例,一方面,出于效率考虑,他们希望单独一家供应商提供全栈工具链,另一方面,出于「安全自主」的担心,又想分散合作,甚至通过自研工具链,延续自己过去在生态中的掌控地位。
某汽车集团 IT 总监直言,选择汽车云服务供应商的考量指标之一就在于,能不能把底层耦合拆干净。「业务和业务之间的协作并不在于云的一体化,我们更看重的是云服务商能不能灵活地适配需求。」
事实上,已经有云服务商正在将各模块解耦,以实现帮助车企降本增效的同时,保证后者还拥有打造云能力上的主导权。
据某汽车云厂商介绍,其所提供的工具链分为数据、训练、仿真、监管四部分,完全开放解耦、不绑定,客户随时可以替换。《白皮书》总结,这标志着云服务模式正在经历从「授人以鱼」到「授人以渔」的全新转变。
随着自动驾驶踏入大规模商业化,一场浩浩荡荡的数据革命已然展开,并正在重塑汽车产业的格局。
一方面,数据给车企带来的是挑战,为应对海量数据产生、处理、交互,需要引入云服务解决,依托强大的存储、计算能力,为车企提供 ICT 资源支撑;
另一方面,数据也意味着无穷的价值,需要调用专业汽车云服务商的能力,在 SAAS 层进行充分挖掘,赋能车企业务。
从最新发展趋势来看,车企对云服务建设的需求已经从简单的拿来即用的云资源升级,转变成了在智能网联各垂直场景专精化,深度融入业务开发的云能力。
要适应这一变化,需要云服务商与车企加强沟通、对齐需求,双向奔赴:车企筛选出亟需云服务赋能的业务板块,而云服务商借助对汽车智能网联业务的深刻洞察,为车企做应用价值点的输入。
与此同时,车企和云服务商还需要构建一个开发合作的生态系统,既让前者免除「被绑定」、无差异化的顾虑,还能发挥出后者高效率、低成本的优势,以此携手共建,加速行业整体变革进程。
值得注意的是,自动驾驶只是云服务赋能智能汽车的其中一个场景,在数字化浪潮席卷之下,汽车云服务更助力车联网孕育出新业态。
《白皮书》中提到,智能网联时代,车企依赖其天然数据资源与获客优势,使得服务从原本的车辆产品交易终点,转变为提供车辆全生命周期服务的起点,而云服务能够帮助车企收集和主动探索数据价值,在增强用户体验的同时,也为车企创造了价值和收益。
具体来说,汽车云推动远程诊断、道路救援、故障监控、状态检测、OTA 云服务、UBI、二手车评估等多个具体应用场景的落地,打通各领域的数据壁垒,创造更为丰富多彩的汽车生态。