随着通用汽车, 戴姆勒, 宝马和奥迪等主流车企都宣布将在2020年前后推出Level 5级别的自动驾驶汽车, 这一领域的竞争已进入白热化阶段. 国际知名投行高盛预测, 自动驾驶出租车的出现, 将使全球共享汽车市场的规模从现在的50亿美元, 到2030年上升至2850亿美元.
毫无疑问, 这是一块大蛋糕, 于是汽车厂商都在不亦乐乎地忙着路测, 然而他们实现雄心勃勃的自动驾驶目标的关键所在, 是利用分析学和人工智能(AI)的力量, 建立自动驾驶系统在实际道路上的反应模式, 并利用现实模拟技术来加速开发进程. 这意味着数据工程, 管理, 存储和分析变得比以往任何时候更加重要. 那么, 汽车制造商到底应该怎么做呢?
首先, 做好准备迎接海量数据的 '洗礼' . 自动驾驶汽车在进行测试时会产生大量数据, 每辆汽车每秒就会产生6~ 8GB的数据. 仅仅在2017年, 该领域就创造了大约250EB的大数据(1 EB= 1024PB, 1PB=1024TB). 汽车厂商需要有先进的概念来处理这些数据并从中获取价值.
其次, 在汽车研发与计算机和数据科学之间搭建一座桥梁. 工程制造是汽车厂商的强项, 但他们对于数据科学可能并不太熟悉. 这些学科的交融, 可以帮汽车厂商打开新大门, 加快其创新和研发. 虽然车企研发部门也有专门的数据工程团队, 但他们经常还是需要借助数据科学以及人工智能领域专家的力量, 以实现最好的研发效果.
再次, 高效处理和分析数据. 当自动驾驶汽车进行测试时, LiDAR, 全景相机和雷达等部件会生产大量以ADTF, ROSbag和MDF4等格式呈现的专业化数据. 现在已经有可以对这些海量数据以PB为单位进行快速访问的工具了. 在过去, 通常需要好几天的时间来提取和分析数据, 而现在只需要几分钟或几秒钟就可以得到结果.
第四, 选择性, 针对性地对大数据进行筛选. 工程师可以使用AI技术来确定哪些数据是有价值的, 哪些可以剔除. 一般而言, 拍摄自动驾驶汽车的测试场景时, 每秒钟会产生30帧视频, 但这些视频大部分都是汽车在开放道路上平稳行驶的场景, 并没有任何特别的事情发生. 这样的视频就算时间再长, 对汽车工程师而言用处也不大. 自动驾驶汽车在转弯, 碰撞或者与其他物体进行互动时产生的数据才更有价值.
最后, 优化自动生成数据. 当一个自动驾驶系统作出一个不同于人类驾驶者的决策, 肯定需要被记录下来. 同样, 当半自动驾驶汽车发生决策错误而被人类驾驶者纠正时, 也要加以重视, 这样工程师可以对系统进行优化. 如果自动驾驶系统可以持续优化和改进, 那么普罗大众对于自动驾驶汽车也会更放心.