隨著通用汽車, 戴姆勒, 寶馬和奧迪等主流車企都宣布將在2020年前後推出Level 5級別的自動駕駛汽車, 這一領域的競爭已進入白熱化階段. 國際知名投行高盛預測, 自動駕駛出租車的出現, 將使全球共用汽車市場的規模從現在的50億美元, 到2030年上升至2850億美元.
毫無疑問, 這是一塊大蛋糕, 於是汽車廠商都在不亦樂乎地忙著路測, 然而他們實現雄心勃勃的自動駕駛目標的關鍵所在, 是利用分析學和人工智慧(AI)的力量, 建立自動駕駛系統在實際道路上的反應模式, 並利用現實類比技術來加速開發進程. 這意味著數據工程, 管理, 存儲和分析變得比以往任何時候更加重要. 那麼, 汽車製造商到底應該怎麼做呢?
首先, 做好準備迎接海量數據的 '洗禮' . 自動駕駛汽車在進行測試時會產生大量數據, 每輛汽車每秒就會產生6~ 8GB的數據. 僅僅在2017年, 該領域就創造了大約250EB的大數據(1 EB= 1024PB, 1PB=1024TB). 汽車廠商需要有先進的概念來處理這些數據並從中獲取價值.
其次, 在汽車研發與計算機和數據科學之間搭建一座橋樑. 工程製造是汽車廠商的強項, 但他們對於數據科學可能並不太熟悉. 這些學科的交融, 可以幫汽車廠商開啟新大門, 加快其創新和研發. 雖然車企研發部門也有專門的數據工程團隊, 但他們經常還是需要藉助數據科學以及人工智慧領域專家的力量, 以實現最好的研發效果.
再次, 高效處理和分析數據. 當自動駕駛汽車進行測試時, LiDAR, 全景相機和雷達等部件會生產大量以ADTF, ROSbag和MDF4等格式呈現的專業化數據. 現在已經有可以對這些海量數據以PB為單位進行快速訪問的工具了. 在過去, 通常需要好幾天的時間來提取和分析數據, 而現在只需要幾分鐘或幾秒鐘就可以得到結果.
第四, 選擇性, 針對性地對大數據進行篩選. 工程師可以使用AI技術來確定哪些數據是有價值的, 哪些可以剔除. 一般而言, 拍攝自動駕駛汽車的測試場景時, 每秒鐘會產生30幀視頻, 但這些視頻大部分都是汽車在開放道路上平穩行駛的場景, 並沒有任何特別的事情發生. 這樣的視頻就算時間再長, 對汽車工程師而言用處也不大. 自動駕駛汽車在轉彎, 碰撞或者與其他物體進行互動時產生的數據才更有價值.
最後, 優化自動生成數據. 當一個自動駕駛系統作出一個不同於人類駕駛者的決策, 肯定需要被記錄下來. 同樣, 當半自動駕駛汽車發生決策錯誤而被人類駕駛者糾正時, 也要加以重視, 這樣工程師可以對系統進行優化. 如果自動駕駛系統可以持續優化和改進, 那麼普羅大眾對於自動駕駛汽車也會更放心.