智能手機3D感測技術新戰線開打

不同於過去的「百萬畫素戰爭」, 大多數智能型手機業者會在3D感測技術這條新戰線打得更辛苦...

三星(Samsung)的最新款智能型手機Galaxy S9已經準備上市, 華為(Huawei)則是即將於下周在法國巴黎舉辦新產品P20的發表會; 成像技術專家表示, 3D感測技術已經成為各家手機業者互別苗頭的最新競爭焦點. 不過有一點還不明確的是, 三星或華為的智能型手機3D感測功能是否夠資格與蘋果(Apple)的iPhone X分庭抗禮?

來自法國之市場研究機構Yole Developpement的MEMS與成像技術研究主管Pierre Cambou表示, 因為蘋果TrueDepth攝影機技術設立了高門坎, 他預測其他競爭對手可能需要一年以上的時間才能提供iPhone X媲美的3D感測技術.

不同於過去的「百萬畫素戰爭」, 大多數智能型手機業者會在3D感測技術這條新戰線打得更辛苦; 這是因為3D攝影機包含眾多需要運作一致的零組件, 還需要充分的供應鏈管理.

Cambou將3D攝影機形容為「一堆子裝置(sub-devices)」, 他指出: 「記得蘋果iPhone X嗎? 參與其中的供貨商包括意法半導體(STMicroelectronics), LG Innotek, 鴻海(Foxconn), 奧地利微電子(ams)還有Lumentum. 」

市場已有一些評論指出三星的S9前向感測技術「令人失望」. 有一篇本月稍早發表的CNET報導評論: 「深入觀察三星的最新生物辨識系統──以及該系統與iPhone X的Face ID之比較──結果顯示它在行動支付上還不夠安全. 」

該報導指出, 「這是因為三星的臉部辨識系統使用標準攝影機來建立用戶臉部的2D圖, 而蘋果的Face ID則是會建立臉部圖形的複雜3D掃描」; 人們已經在三星去年推出的Galaxy S8證實, 能用照片來欺騙三星的臉部辨識技術, 顯然S9也會被一樣的手段欺騙.

至於即將發表的華為P20, 有不少媒體報導都將該款手機的「三鏡頭」視為關鍵功能──為何需要3個攝影鏡頭, 三個會比兩個好嗎?

為此我們詢問了雙鏡頭技術領導供貨商Corephotonics的市場營銷與業務開發副總裁Eran Briman, 他表示: 「三鏡頭是一個全新的技術領域, 才剛剛起步, 還未證明其價值 ; 」他指出三攝影機可能會有很多型態與配置, 那些鏡頭可能各有目的, 包括支援「低光線拍攝, 變焦, 景深, 高解析度以及整體影像質量. 」

根據Briman的說法, 三攝影機的組合可能包括: 1. 一支彩色(RGB)鏡頭, 一支黑白鏡頭, 第三支攝影機則是提供超寬廣視場(field of view, FoV)或是兩倍遠距窄FoV; 2. 一支魚眼鏡頭, 一支標準廣角鏡頭以及一支兩倍望遠鏡頭; 或者是3. 一支標準廣角鏡, 一支兩倍望遠鏡以及一支五倍望遠鏡, 以支援超級變焦(super-zoom)功能.

他指出: 「也有可能是其他配置, 包括不同的影像感測器; 」但重點在於: 「相較於雙鏡頭設計, 所有的三鏡頭配置都可以提供更精確的深度資訊. 」

Briman表示: 「主要原因是, 實際上其基線(baseline, 即鏡頭間的距離)會變得更大, 特別是第一個與第三個鏡頭; 當基線數值越大, 深度資訊就越準確──不過在軟體方面的挑戰很大, 需要處理遮蔽(occlusion), 同步等等問題. 」他補充指出: 「此外藉由整合來自三個攝影機的資訊, 理論上可以得到更好的深度資訊. 」

換句話說, 華為的三鏡頭方案顯然是為了展現該公司在強化深度感測技術方面的努力成果──雖然未經證實, 業界猜測高通(Qualcomm)是華為的3D感測技術合作夥伴; 在去年夏天, 高通宣布與奇景光電(Himax Technologies)合作打造完全整合的結構光模組(structured light module, SliM). 高通當時表示, 其3D深度感測攝影機模組將在今年第一季量產.

3D感測技術領域有哪些重要廠商?

那麼在智能型手機3D感測技術領域有哪些關鍵供貨商? 在我們討論這個題目之前, 先複習一下蘋果的3D攝影機運作原理:

蘋果TrueDepth攝影機結構

(來源: Yole Developpement)

如同Yole先前所解釋的, iPhone X能辨識用戶臉部並解鎖手機, 是結合了ToF測距感測器與紅外線「結構光」相機, 因而能使用均勻的「泛光」或「點陣圖案」照明. 首先, iPhone X結合了紅外線相機與泛光感應組件, 從而在手機前方投射出均勻的紅外光; 接著拍攝影像, 並此觸發臉部辨識演算法.

然而, 這種臉部辨識功能並非持續運作. 連接到飛行時間(ToF)測距感測器的紅外線相機發出訊號, 指示相機在偵測到臉部時拍攝照片. iPhone X接著啟動其點陣式投射器拍攝影像. 然後將一般影像和點陣圖案影像傳送至應用處理單元(APU), 用於進行神經網路訓練, 以辨識手機用戶以及解鎖手機.

Yole的Cambou指出, 此時尚未開始進行3D影像的運算, 3D資訊包含在點陣圖案影像中. 「為了執行3D應用, 同一個APU可以使用另一種計算影像深度地圖的演算法; 」他補充: 「由於採用了運算密集的結構光途徑, iPhone X充份利用了A11晶片的強大處理能力. 使用神經網路是得以實現這一設計的關鍵技術. 」

基本上有三種類型的技術能實現3D感測, 包括立體視覺(stereo vision), 結構光以及ToF感測; Yole所提供的以下表格可以看到這三種技術的優缺點與特性比較:

三大3D感測技術比較

(來源: Yole Developpement)

而因為每個3D攝影機都包含了一堆子裝置, Yole針對以上三種類型技術提供了一些組件供貨商組合線索.

首先, 立體視覺或主動立體視覺(active stereo), 能透過結合由Omnivision或ST提供的全局快門近紅外線(NIR)攝影機, 以及歐司朗(Osram), Lumentum, Finisar的NIR照明(可選), 還有Iniutive, 英特爾(Intel)/Movidius所提供的3D硬體加速器(即視覺處理器).

其次在結構光部分, 必要的子裝置包括全局快門NIR攝影機, 一樣是有Omnivision或ST等供貨商; 還有結構NIR照明組件(可選), 供貨商是奧地利微電子, 奇景光電, 韓國業者Namuga以及歌爾(Goertek) ; 此外是3D重建軟體, 供貨商有Apple Primesense, Mantis, Namuga與奧比中光(Orbbec).

第三種ToF方案, 則需要供貨商包括pmd, Sony/Softkinetic的ToF鏡頭, 以及歐司朗, Lumentum, Finisar與奧地利微電子等廠商的NIR照明組件(可選). Cambou指出, 奧地利微電子與意法都提供ToF近接探測器, 但只支援幾個畫素, 輛家公司都還未開發ToF攝影機.

蘋果設下的高競爭門坎

假設iPhone X的TrueDepth如同Yole所說的遠勝所有競爭者, 究竟其他3D感測技術方案是少了什麼?

對此Cambou認為, 「神經引擎」(neural engine)是一個關鍵, 也是蘋果的競爭對手難以跨越的障礙: 「高通顯然已經有了『me too』解決方案... 但還未看到成果; 」此外他表示: 「你需要夠力的2D-3D攝影系統, 適合智能型手機前置, 成本要低於15美元, 」這不是完全不可能, 但真的很難做到.

iPhone X的光學中樞系統成本

(來源: Yole Developpement與System Plus Consulting)

此外Cambou補充, 該系統還需要達到一定程度的生物辨識效果, 如果一張照片就能騙過系統, 那方案就沒用; 他認為這是問題所在: 「蘋果從一開始就知道要用3D攝影機來做什麼, 是包括生物辨識方案在內的用戶介面, 」 而其他競爭對手只是嘗試要賣廉價版的相同功能.

Cambou指出: 「蘋果辨識系統需要的性能等級, 已經設立了超越所有競爭者技術能力的標準; 奇景光電的窘境意味著手機業者還沒有充分了解其應用重點. 」

那除了高通與奇景光電的合作, 還有其他案例嗎? Cambou指出, 聯發科(Mediatek)也打算以APU供貨商的角色加入3D感測戰場, 打算以卷積神經網路(CNN)──類似於蘋果的神經引擎──來支援生物辨識; 而他表示, 聯發科顯然會在未來替小米(Xiaomi) 提供CNN加速器, 將與奧比中光設計的3D攝影機結合.

3D感測技術市場預測

(來源: Yole Developpement)

Cambou還表示, 如果手機的臉部辨識系統將會用於行動支付, 我們永遠可以爭論哪種3D攝影機模組更安全, 但有一件不可忽略的事情, 就是中國因素. 舉例來說, 最終只要支付寶認定哪種3D感測技術夠好, 就會被中國市場認可──中國有一大部分人口都已經依賴像是微信支付, 支付寶等行動支付方案, 而這會成為3D感測技術贏家的最大決定因素.

編譯: Judith Cheng

2016 GoodChinaBrand | ICP: 12011751 | China Exports