我們此前已經就相對上一代產品的技術創新所帶來的驚人回報和相應的架構技術變革展開了深入討論. 此次, 我們將討論具體的性能提升以及為終端用戶所帶來的改善.
全新變化 首先, Mali-D71 通過在固定功能硬體中進行迭加, 旋轉, 高品質縮放, gamma/de-gamma和其他先進的映像處理任務, 減少需要 GPU 處理的工作負載. 這一切是在多媒體流水線最後階段完成的, 即在它向屏幕發送最後的輸出內容之前, 這意味著GPU 根本不用參與這些操作. 此外, 完成這些運作只需經過記憶體一次, 而不是來回多次, 這樣就大幅提升了系統的節電效能. 舉個更具體的例子, 為了一台1440p 設備縮放4K視頻層, 將其與複雜的沉浸式UI圖形層進行合成, 對比利用GPU軟體進行同樣的操作, SoC 可節電30%.
與前代產品相比, Mali-D71以並行模式運轉時可在同樣的面積裡事項兩倍的性能. 與前代產品不同的是, 當Mali-D71驅動單塊顯示屏時, 可以重複使用第二個顯示核心的資源. 這樣一來, 它可以迭加, 旋轉和縮放的圖層數量加倍, 但並不會增加整體面積. 這就意味著在與前代產品相同的晶片面積內, Mali-D71可以提供新的增強功能, 比如縮放拆分操作, 未壓縮層的AFBC編碼, 更快的AFBC解碼和MMU優化. 當Mali-D71顯示處理器與同時發布的CoreLink MMU-600一起使用時, 整合的轉換緩衝單元(TBU)以及兩者通過 DTI介面實現的緊密耦合大幅降低了MMU延遲.
此外, 實現4倍的延遲容忍度. 相較於前代產品Mali-DP650, Mali-D71 在實現同樣的顯示性能時, 容許系統匯流排上4倍的延遲. Mali-D71 實現了記憶體子系統的大幅優化. 它允許的待處理請求的數量加倍, 從即時路徑中移除了未經壓縮的旋轉, 將未經壓縮的線性層轉換成AFBC1.2 tiled層, 從而實現更高效的旋轉. 這對於必須將4K幀以60-120 fps的幀率輸出的高性能顯示處理來說十分重要. 為了做到這一點, 顯示處理器需要最大程度地利用佔有系統匯流排上的時間, 在顯示屏空白時以毫秒為單位預取像素, 確保緩衝區一直保有足夠的內容. 如果顯示屏沒有及時接收到像素, 它就會因缺乏內容出現丟幀的問題, 導致屏幕上出現毛刺或明顯偽差, 影響畫質.
最後, Mali-D71將像素吞吐量增加了一倍, 以呈現極致的VR 4K120效果. 它在全新的並行模式下驅動單塊顯示屏時可以做到這一點. 當只需要為一個顯示進行輸出時, 並行模式將映像一分為二, 高效地利用兩套資源各處理一半的映像. 對於 4K60 及以下工作負載, 並行模式可以將時鐘頻率降低一半, 從而支援更低電壓, 實現節電效能. 對於4K120 工作負載而言, 並行模式是強制性要求, 從而針對相同的目標頻率實現了像素吞吐量的加倍. 如果不採用並行模式, 只可能達到4K60, 所以通過並行處理將幀處理需求減半的能力意味著功耗減半或是性能加倍.
背後的重要意義Arm實際上並不生產實體產品, 我們的IP要變成晶片還得花點時間, 更不必說真正的設備出產了. 而這意味著我們必須始終領先趨勢 (至少) 一步, 並關注最新科技對現狀所帶來的顛覆性影響, 才能使基於Arm的產品擁抱這些科技趨勢. 在顯示行業湧現出來的具體趨勢當中, 有些會對我們打算利用全新的Komeda顯示架構和已經推出的整體解決方案實現的性能和特性產生較大影響. 針對這些趨勢的討論, 你可以點擊此處查看我的一位同事近期所做的更詳細介紹, 而我將主要討論Arm全新顯示解決方案是如何應對這些挑戰的.
1. 高動態範圍在顯示領域, 最先出現的必備要素就是高動態範圍 (HDR). HDR 內容在更廣的動態範圍裡被編碼, 以呈現更加細膩的色彩和對比度. 這就使得映像上的暗黑區域變得更暗, 更加層次豐富, 較亮的區域則變得更明快, 更清晰, 更飽和, 避免它們像我們有時在亮光下在映像上看到的一樣變得模糊. 越來越多的內容建立者利用HDR提供極致的觀看體驗, 可如果不能將它們恰當地顯示出來, 就是在浪費時間. Mali-D71搭配Assertive Display 5, 從你較為青睞的內容供應商比如Netflix和亞馬遜 Video那裡獲取HDR內容, 之後在任何類型的面板上 (即便是SDR) 都可以以HDR畫質進行顯示. Mali-D71本身獲取HDR視頻和圖形UI 的重疊區, 將它們融入以標準伽馬編碼且帶完整色域的單幀裡, 然後發送給Assertive Display 5轉換成正確的色彩範圍, 用於SDR顯示.
這意味著如果你用的只是一款普通的顯示處理器, 那麼內容建立者在以HDR10格式設計作品時所花費的心血全部付諸東流. 有了Mali-D71, 你就可以重現同樣令人歎為觀止的HDR畫質, 在更低規格的顯示器上也不例外, 完整保留這些內容的藝術匠心.
2. VR正如我們之前多次討論過的那樣, 移動VR提出又一項技術挑戰. 對顯示處理器以及系統其他部分來說, 僅僅滿足即時延遲和數據吞吐量方面的要求就已經很困難了, 更不必說顯示設備在靠近眼睛時, 對像素質量有更高的要求了. 這裡就要說一說我們之前提到過的延時容忍度, 還有並行模式的節電及性能提升. 但是, 藉助搭配全新的CoreLink MMU-600, Mali-D71能夠真正物盡其用. MMU-600將記憶體子系統進行優化, 使得 Mali-D71可以最大限度地利用經過優化的記憶體子系統去驅動最高性能的VR顯示器達到4K120fps 的水平, 從而在系統匯流排上能夠容忍更長的延遲.
3. 多窗口顯示由於人們使用手機的頻率越來越高, 那麼我們對多任務處理的需求也就越來越高. 目前的台式機已經可以幫我們實現坐在電腦前時, 一半顯示屏用來顯示線上會議, 另一邊則顯示電子郵件或是Facebook內容. 現在, 我們希望可以在移動設備上進行同等程度的多任務處理. 這意味著顯示子系統的功能需要更強大, 以便同時開展這些不同的活動. 前幾代的顯示處理器可以最多處理4層數據, Mali-D71則提升了一倍, 可以在單一顯示模式下處理8個Android迭加層. 再加上拆分屏幕的功能, 這就意味著 Mali-D71可以不費吹灰之力就可以處理你的UI, 導航欄, 狀態資訊以及幾個完全不同的應用程序. 4. 屏幕, 屏幕, 屏幕和科技行業裡的許多事情一樣, 一致性才是王道. 要想調整你的應用程序和遊戲, 讓它們在多個平台上運行, 這一點很難. 顯示面板也是如此, 顯示面板基礎的技術, 性能點是如此之多, 要知道顯示處理器可能需要從顯示面板獲取那些資訊 (反之亦然) 以達到最佳工作狀態真的很難, 但這正是 Arm合作夥伴生態系統大顯身手的地方. 通過與行業裡各式各樣的專家合作, 我們可以鎖定各種面板供應商, 確保我們的顯示解決方案可以獲取可用資訊, 優化內容, 在各種面板上呈現最佳的觀看體驗.
顯示生態系統給予我們前所未有的機會與專家合作, 為用戶創造最佳的體驗.
VR和HDR使用場景需要WQHD+和4K解析度以及90/120的幀率, 這給消費電子產品市場在功耗, 成本和上市時間等方面都提出了新的挑戰. Arm的Mali-D71顯示處理器和 Synopsys公司通過晶片驗證且配置VESA DSC編碼器的DesignWare MIPI DSI Host Controller IP和MIPI D-PHY IP提供了一個完整的顯示解決方案, 確保這些關鍵IP部件無縫整合到不同數據傳輸模式和顯示面板特性的應用處理器上. ——Synopsys 公司高級產品營銷經理Hezi Saar
Mali-D71可以為新一代基於顯示屏的移動產品 (比如AR/VR頭盔) 實現前所未有的 4K120像素吞吐量. 利用Mali-D71和Hardent公司的VESA DSC組合解決方案, 你可以在既定的移動功耗範圍內, 通過視覺無損壓縮將傳輸頻寬減少3倍, 從而實現讓用戶覺得更加身臨其境的VR體驗. ——Hardent 公司 IP 產品副總裁Alain Legault
Arm和Analogix正在積極開展合作, 為頭戴式VR/AR應用的處理器和顯示驅動IC制定一項協議, 優化工作負載, 終極目標就是提供一款整個AR/VR系統的性能, 成本和功耗等方面都堪稱最優的解決方案. ——Analogix 公司首席技術官朱寧
Arm 完整的顯示解決方案今天我們發布了第一套完整的Arm 顯示解決方案, 以支援在下一代高端設備上運行的所有最新的使用場景. 雖然這些產品的功能都很出眾, 但是只有當這三樣產品合力去達成我們之前討論過的性能點, 才能實現最大效益. 全新的架構, 再加上預先優化的軟體棧和整合的CoreLink MMU-600和Assertive Display 5技術, 未來設備上的顯示效果必將大放異彩.