自动驾驶汽车数据采集应用如何实现进阶?

导语:笔者结合云服务平台提出了自动驾驶汽车数据采集信息管理平台的设计构想及功能应用实践同时对该信息管理平台应用中存在的问题进行分析阐述提出相应的改进措施

在“双碳战略”背景下,纵观全球的汽车产业正在经历着全新的产业变革和科技转型,“数字经济、人工智能、智能网联”等新技术、新理念已经成为驱动产业创新发展的新动力、新源泉。


“智能化、网联化、电动化、共享化”已经成为未来汽车行业发展的主要潮流。然而,自动驾驶汽车的研发过程中,不可避免地需要采集大量的数据。我国对于自动驾驶汽车的数据采集这一领域的监管措施和管理法规相对不足,造成了该领域内数据采集的监管薄弱、数据安全得不到保障、数据采集设备“五花八门”、数据格式类型多种多样、数据采集主体“鱼龙混杂”、个人隐私信息存在泄露等现实问题与风险。


伴随着《深圳经济特区智能网联汽车管理条例》(简称《条例》)于2022年8月在深圳率先施行,这标志着我国对自动驾驶汽车的管理正式进入了有法可依的探索阶段,对于我国自动驾驶汽车产业的发展有着举足轻重的历史意义。依据该条例第六章第四十六和四十七条规定,自动驾驶汽车企业应建立网络安全评估与管理机制、数据安全管理制度、隐私保护方案等,并采取相关措施对数据安全进行防护。为此,建立统一的自动驾驶汽车数据采集信息管理平台具有十分重要的实践意义。该平台的建立有利于自动驾驶汽车数据采集规范化、标准化和专业化,有利于行业资源的优化、有利于监管部门实现数据的统一管理。


一、自动驾驶汽车数据采集的现状分析


自动驾驶汽车数据采集


自动驾驶的实现需要装载多种不同种类的传感器,采集大量数据,从而对感知到的数据进行融合处理,以便提升自动驾驶的感知、决策和控制系统的可靠性和稳定性,进而控制车辆的运行。根据研发阶段的不同,自动驾驶汽车数据采集可分为感知系统算法训练的数据采集、自动驾驶功能验证的数据采集、自动驾驶性能评价的数据采集及客诉问题的复现验证采集等。


按照当前行业内较为先进的汽车数据采集设备来估算,一辆自动驾驶汽车每小时采集的数据量可达1 TB。假定需要采集10 km里的汽车数据,按照每天采集里程500 km,每天16 h采集时长(白天8 h+晚上8 h)进行测算。那么,整个数据的采集量将高达到3.2 PB。


自动驾驶汽车数据采集的主体主要包括三大类:第一类是自动驾驶的整车厂商,比如吉利、上汽、蔚来、小鹏、理想等。第二类是与车企配套的自动驾驶零部件供应商,比如博世、大陆、安波福、采埃孚等。第三类是具备国家测绘资质的图商,比如四维图新、立得空间、光庭信息等。


自动驾驶汽车数据安全


自动驾驶汽车数据采集的数据类型可以分为五类,即:基本属性数据、环境感知数据、运行控制数据、应用服务数据以及用户个人数据。 其中,环境感知数据中包含了车辆道路实时采集的目标物数据,如行人、车辆、车牌、建筑物及道路交通状况的数据。这部分数据涉及到我国国家安全信息,如军事管理区、国防科工等涉密单位、党政机关等重要敏感区域的数据信息等,所以,对于这部分数据的采集需要严格按照国家测绘相关法律法规来监管执行。


另外,对于涉及到的人脸面部特征信息、用户车牌信息、车辆位置信息、驾乘习惯等个人用户隐私数据,需要按照《中华人民共和国个人信息保护法》相关规定进行数据脱敏处理。因此,数据安全管控问题已经成为了当前自动驾驶汽车数据采集领域中越来越重要的议题。


数据采集信息管理平台建设的必要性


PEST分析模型是对影响行业或公司的外部宏观环境因素进行具体分析的方法论。它主要从政治、经济、社会和技术这四个层面对影响行业或公司的外部环境因素进行分析。


首先,从政治环境角度来看。在新时代背景下,党的十九届五中全会制定了“十四五”期间我国经济发展的总体规划,明确指出了必须要坚持创新驱动,充分塑造新发展优势。为贯彻落实“十四五”规划的各项措施,中央网络安全和信息化委员会还发布了《十四五国家信息化规划》,就“十四五”期间中国信息化发展进行部署和安排。在“智能网联”推广和普及方面提出要加快智能网联汽车相关基础设施的建设。


国家交通运输部同时也发布了《数字交通十四五发展规划》。规划中提出,“十四五”期间将推动自动驾驶、智能航运测试基地与先导应用试点工程建设;“十四五”期间将加强相关通信接口和协议统筹、推进车路协同及自动驾驶相关标准落地。


在法律法规方面,随着深圳市出台的智能网联汽车管理《条例》的正式施行,这是我国首次开始对自动驾驶汽车行业法律法规进行探索和尝试。与此同时,国家交通运输部也印发了《自动驾驶汽车运输安全服务指南(试行)》(征求意见稿),这为自动驾驶汽车行业进一步商业化、产业化提供了有力的政策支持。


图1 2022年上半年,全国居民人均消费支出分布图

图2 2020-2021年,中国乘用车L2级以上自动驾驶功能搭载量及装配率

图3 2021年Q1-2022年Q1,中国乘用车L2及以上自动驾驶功能搭载量及装配率


随着法律法规的进一步完善,相信自动驾驶汽车数据采集领域也将会逐步规范健全。其次,从经济环境视角来看,中国经济发展已经进入新常态,据国家统计局公布的统计数据显示,截至2022年7月末,2022年上半年中国国内生产总值为562642亿元,比2021年同期增长了2.5%。其中,受疫情影响,交通运输业、住宿餐饮业增加值呈下行趋势。而金融业、信息传输、软件和信息技术服务业发展较好,增加值分别同比增长5.9%和7.6%。


由此可见,尽管有疫情影响,我国经济发展形势有所减缓,然而信息传输、信息技术服务业的发展势头仍然强劲。为了更有效地对我国自动驾驶汽车数据采集领域进行合理监管,更高效地优化数据采集资源,构建自动驾驶汽车数据采集信息管理平台至关重要。


据国家统计局最新的数据显示,2022年上半年我国居民人均消费支出为11756元,比2021年同期有所增加,呈现恢复性增长态势。我国人均交通通信消费支出达到1493元,在人均消费支出中的占比为12.7%,同比增长2.6%。另外,研究报告表明,2021年中国乘用车市场上L2级汽车自动驾驶功能搭载量达到4209363辆,装配率达到20.7%。2022年第一季度,我国乘用车L2级以上汽车自动驾驶功能装配率达到30.1%,同比增加了12.7%;其中,L2级装配率更是高达25.7%。由此可见,消费者在交通通信上消费支出需求持续的增长,我国乘用车市场上自动驾驶功能装配率的稳步增长,消费者对自动驾驶功能的认识和接受程度也在持续提高,自动驾驶行业发展态势总体向好。因此,自动驾驶汽车数据采集信息管理平台也将会有更广阔的应用增量和市场。

图4 自动驾驶汽车数据采集信息管理平台体系架构


最后,从技术环境角度分析,自动驾驶技术是“人工智能、智能网联”发展最前沿的领域,拥有广阔的市场和前景。当前,L2、L2+级别的自动驾驶辅助功能已经成为了很多新车上市的标配。随着国内行业法律法规的进一步完善,L3级别的自动驾驶技术时代也已经到来,自动驾驶技术的发展也由技术驱动向数据驱动进行转型。数据采集、数据存储、数据处理、数据传输、数据挖掘、数据分析、数据应用等贯穿着整个自动驾驶系统开发的全过程。因此,建立自动驾驶汽车数据采集信息管理平台具有非常重要的意义。


二、自动驾驶汽车数据采集信息管理平台


信息管理平台的体系架构设计


为了能够更精准地感知车身周围的环境,自动驾驶汽车车身上搭载有众多的传感器,传感器在实际运行过程中将产生海量的数据。数据采集、数据传输、数据分类、数据标注、数据存储、算法训练、仿真测试等环节贯穿于整个自动驾驶系统研发的生命周期。那么,对于自动驾驶车企而言,如何去合理地管理和使用这些数据呢?一个弹性灵活、按需部署、节约投资、安全且低运维成本的云服务数据管理平台无疑是比较合理的选择。

图5 网络拓扑示意图


基于云服务的类型,可向终端用户提供三类服务:IaaS基础设施即服务、PaaS平台即服务、SaaS软件即服务。 该信息管理平台体系架构是基于PaaS服务类型,并采用混合云方式来部署设计的。云服务提供商将提供所有的基础设施(机房、配电等)、物理设备资源(服务器、存储、网络等)、虚拟机、操作系统平台、权限设定、运维管理、运营管理等服务,自动驾驶企事业单位作为终端用户将基于云服务提供商的平台资源基础之上开发部署自动驾驶汽车数据采集信息管理平台,完成数据处理、数据分析、数据分类、视频回放、数据标注、数据采集轨迹实时监控、数据采集指标设定及进度分析、算法训练、场景建模、场景库仿真测试等开发工作。政府相关监管部门也将以用户端接入该平台,对自动驾驶企事业单位的数据采集工作做好相关审批、监管工作。


混合云部署方式既有公有云快速高效、节省成本、高扩展性、高可靠性的优点,也具备了私有云高安全性的特点。自动驾驶系统在开发过程中采集的海量数据,可以根据实际的开发需求动态地调整云服务平台上的资源。比如:数据存储高峰时,动态扩展数据存储资源池的容量、数量等;大数据处理分析时,动态地增减虚拟服务器资源等。对于自动驾驶系统核心的算法训练、场景库构建、场景仿真测试等核心业务则布置在私有云上进行,提高数据使用的安全性和保密性。公有云与私有云之间的数据传输采用专线加密通道。


三、信息管理平台的功能应用实践


数据采集主体资质监管


根据国家的相关法规规定,符合数据采集主体的企事业单位需要具备地图测绘相关资质。数据采集相关企事业单位可以通过该平台上传数据采集的资质证明,向政府相关监管的职能部门做好报备工作。待得到审批后,才可以进行数据采集工作,坚决杜绝不合规的企事业单位进行数据采集。

图6 数据采集情况统计图


数据采集规范化管理


由政府相关部门协调组织业内的数据采集企事业单位,统筹规划数据采集的规范要求,做到数据格式统一化管理、数据采集设备规范化要求,避免数据采集设备种类繁多,数据格式多样,数据传输过程中的数据加密解密需合规处理,便于政府相关职能部门做好监管,也有利于自动驾驶企业在项目的开发过程中对数据进一步挖掘和循环利用,缩短项目开发周期,节约项目开发成本。


数据采集计划及路径规划管控


数据采集企事业单位可以通过该平台结合所需要采集的数据场景、交通特征等筛选出数据采集的地点、城市、道路设施等,自动生成数据采集的规划路径,并将需要采集的路径规划以及数据采集计划向政府监管部门提交申请,待政府相关监管部门审批通过后方可进行路试数据采集工作。


数据采集轨迹统计


数据采集技术人员可以通过在自动驾驶数据采集车辆上加装定位设备,将自动驾驶数据采集车辆的行驶轨迹实时地传送至该平台的地图系统中,便于数据采集后台管理人员对数据采集工作进行统计分析与管理。


数据采集指标设定及其统计分析


该平台可以对数据场景的采集指标进行设定,并对当前的采集数据进行统计分析、形成可视化图表,便于对数据采集任务和指标进行可视化管理。比如,高速公路跟车场景的采集指标,原计划采集时长设定为1200 h,当前已经完成有效采集时长达到了856 h,那么可以直观地看到该指标已经完成的情况。


数据挖掘检索功能


该平台具备不同维度的数据信息检索功能。比如:检索数据采集车辆的信息、数据采集里程数、数据信息特征提取、全景视图可视化回放等。该功能便于验证自动驾驶系统在特定场景下的逻辑控制策略。当客服售后端反馈在特定的场景下,系统存在潜在问题,需要进一步分析时。可以使用该检索功能,检索特定场景所需满足的条件,然后提取相对应的数据log,再进一步进行系统验证分析。


敏感数据清洗脱敏处理


该平台能够将采集中涉及到的敏感数据进行脱敏处理并删除,保障数据的安全性。并对采集过程中有损坏的、重复的或丢失的数据进行清洗处理,删除无效数据,确保数据的有效性。对于自动驾驶数据采集过程中的数据安全问题做好进一步的管控措施,同时,平台上存储的有效数据全面接受政府相关部门的监管、抽查。


数据分类及标注


该平台对采集到的视频数据进行标注、分类管理。比如天气类的分类标注:雨天、晴天、大雾、雪天等;交通标志类的分类标注:限速标志、交通标线、收费站标识等;驾驶场景分类标注:跟随前车、邻道切入、主道切出、前车减速、匝道并线等;特殊场景分类:交通路障标牌、道路施工标牌、交通事故场景等;目标识别分类标注:交通路口行人穿行、电动摩托车等,此分类数据将用于视觉识别算法训练。对问题场景数据进行标注分类,比如LCK场景、AEB场景、FCW场景等,此分类数据用于ADAS ECU功能逻辑的验证测试。对客诉问题数据进行分类,比如AEB失效问题数据、LKA纠偏不足问题数据等等,此分类数据用于对客诉问题进行再验证。通过对数据的分类管理,将更有利于ADAS产品开发过程中进行算法训练和台架仿真模拟测试,加快产品开发周期、节约车企开发成本。


四、如何改进自动驾驶汽车数据采集管理平台的应用?


存在的问题


随着自动驾驶产业发展的不断深入,自动驾驶行业发展十分迅猛。然而,国内现有的行业规范、法律法规仍然处于探索阶段,对汽车数据采集领域的管控仍然比较薄弱。比如:数据采集的使用权责划分、数据采集的归属权责划分、数据跨境传输的监管、政府监管部门的权责定义、对违规采集主体的管理措施等等。针对这一现状,政府相关职能部门仍然需要进一步去规范、完善相关法规措施。


该信息管理平台采用云服务平台的方式对数据进行存储和管理。从数据安全性和可靠性而言,尽管云服务平台已经具备了一定的安全保障措施,但是在实车采集原始数据至上传云服务平台的这段数据传输过程仍然存在着安全隐患。传统的自动驾驶汽车数据采集过程中,对于数据传输通常采用磁盘拷贝的方式进行流转管控。此方式虽然能够有效地进行数据传输,但是费时费力,还容易因为磁盘在运输过程中损坏导致了数据的失效、丢失。因此,数据传输过程的安全管理也是不容忽视的。


自动驾驶汽车数据采集的驾驶场景需要尽可能多地覆盖现实中的驾驶场景,以便于更好地对自动驾驶系统的决策控制逻辑进行测试验证。然而,有一些特殊的场景是无法进行实车数据采集的。比如:在极端天气因素的情况下,需要在高速公路上以超过120 km/h的时速行驶并采集数据。在实际的驾驶场景中,时速超过120 km/h在高速上行驶的行为是违法的;再比如:需要采集在120 km/h的高速情况下遇到紧急情况时,车辆紧急制动的场景。这样的驾驶场景,危险系数极大,在实际的实车路试数据采集中是不现实的。因此,自动驾驶系统在这些特殊场景下如何进行决策控制就成为了整个系统开发测试验证过程中的难题。


改进措施


针对自动驾驶行业的汽车数据安全法规制度不完善的现状,政府相关职能部门应该尽快出台相关的法律法规和实施细则,在实践中不断地完善该行业的法规条文,填补法律漏洞。同时,就现阶段法规不完善的情况下,进一步探索对汽车数据采集的监管措施和跟踪方法,对数据出境等危及国家安全和公民个人隐私信息的行为做出有效监管。对汽车数据采集的相关行业进行统筹规划,出台行业规范要求。比如:统一数据采集的格式要求,规范数据采集设备标准,明确数据采集的权责定义、数据归属权的划分,制定数据传输的安全规范和操作标准等。该信息管理平台主要涉及到云服务提供商、数据采集主体方、数据最终使用方以及政府相关监管部门。为了避免相关各方对数据的私自滥用,那么对于自动驾驶汽车数据采集的归属权责、使用权责的划分定义也具有重要意义。


由于涉及到相关交通安全法规和人身安全等因素,一些特殊的驾驶场景在现实中无法进行实车数据采集。针对这样的实际问题,可以考虑在该信息管理平台中部署专业化软硬件来构建虚拟的测试场景库,从而满足自动驾驶系统技术开发中的仿真测试验证需求,在云服务平台中进一步地去进行仿真测试验证,提高自动驾驶系统的可靠性和稳定性。比如:CarMaker、CarSim等仿真工具。


当前,具备测绘资质且又掌握自动驾驶相关专业技术的专业性人才相对比较稀缺。要解决这个问题,可以从以下三个层面去考虑改进。从国家层面,我们需要加强对这方面人才的培养,以便于满足不断增长的自动驾驶行业趋势。比如:设立相关的专业资质培训考核体制,为自动驾驶行业培养长期稳定的人才资源;从企业层面,需要鼓励相关从业人员,加大激励措施,提高专业性人才的福利待遇,为企业的发展提供不竭的动力,从个人层面,需要根据行业发展的动态,适时地把握学习机会、提高技能,为企业、为国家的发展贡献力量。


五、结论与展望


当前,我国自动驾驶汽车产业的发展仍然处于起步阶段,但是自动驾驶汽车产业迅猛发展趋势不会改变。笔者通过对自动驾驶汽车数据采集领域的现状、建立数据采集信息管理平台的必要性、数据采集信息管理平台体系架构设计以及应用实践等相关内容展开分析,结合信息管理平台应用中存在的现实问题和改进措施。得到基本结论如下:


自动驾驶汽车数据采集信息管理平台有助于政府相关职能部门对自动驾驶行业的数据采集进行监管,对于不合规的数据采集加强管理。同时,也有利于政府部门加快完善自动驾驶行业的法律法规。特别是对当前数据采集的归属权、使用权责的进一步划定具有非常重要的意义。


自动驾驶汽车数据采集信息管理平台有助于数据采集相关主体单位对数据采集计划、采集路径规划、采集轨迹管控、采集数据统计分析做出更为全面的分析统计,有利于对数据采集任务做出合理的调整。


自动驾驶汽车数据采集信息管理平台有助于自动驾驶行业进行数据利用和挖掘,为自动驾驶台架仿真模拟测试和算法训练提供数据支撑。


自动驾驶汽车数据采集信息管理平台有助于驱动自动驾驶行业向数据平台化发展,促进自动驾驶行业与大数据平台相结合的模式,进而带动整个产业链的发展。


展望未来,自动驾驶行业仍然是我国建设社会主义现代化强国的重要领域和前进方向。自动驾驶汽车数据采集信息管理平台的研究和建设也会是未来几年行业内重点研究和探讨的课题。

暂无评论,等你抢沙发

  • 短信登录
  • 密码登录
还没有账号,
登录即代表您同意本网站的 《用户注册协议》
还没有账号,
登录即代表您同意本网站的 《用户注册协议》
注册
已有账号, 立即登录
登录即代表您同意本网站的 《用户注册协议》
找回密码