人工智能(AI)发展愈加快速, 并开始大举进军终端装置, 运算分析已开始从云端转向终端节点, 边缘运算发展可说是目前半导体产业热门议题, 而2018台北国际计算机展(Computex 2018)也成为各领域业者(如IP, 芯片, 储存) 火力展示的绝佳场合, 纷纷于展会期间发布新的解决方案或市场布局规画.
抢攻边缘运算市场 Arm动作频频
Arm IP产品事业群总裁Rene Haas(图1)表示, 随着物联网的蓬勃发展, Arm预测至2035年全球将会有超过1兆台的联网装置, 运用于医疗, 汽车, 灯具及道路等范畴, 而联网装置数量的大幅成长也将带领终端及云端运算的持续发展. 智能运算将持续推动物联网崭新时代, 带领AI变革, 促使物联网智能运算无所不在.
图1 Arm IP产品事业群总裁Rene Haas表示, 物联网蓬勃发展将使联网装置快速增加, 智能运算未来将无所不在.
因应此一趋势, 且为整合生态系统的AI/机器学习(ML)应用, 演算与框架, 并结合软件优化与硬件IP产品, 让各式装置及平台都能支持最常使用的机器学习框架, Arm近期宣布推出三款全新IP产品, 分别为Cortex-A76 CPU, Mali-G76 GPU, 以及Mali-V76 VPU, 以提升游戏与AR/VR体验, AI和机器学习能力. 透过这三款新产品, Arm将持续强化该公司于行动领域的竞争优势, 也再度增强了智能手机, 平板计算机, PC等行动终端装置的运算效能.
Arm副总裁暨客户事业部总经理Nandan Nayampally(图2)表示, 未来5G将推动整个行动产业创新, 即将到来的5G联网应用, 包含VR, AI或是手机游戏等将会带动更多运算量成长, 未来将会有更多不同运算需求产生.
图2 Arm副总裁暨客户事业部总经理Nandan Nayampally指出, 5G加AI将推动整个行动产业创新, Arm为此推出全新IP产品因应市场需求.
Nayampally进一步指出, 游戏也是推动行动装置运算持续攀升的关键因素之一. 游戏产业已成目前全球营收规模最大的市场之一, 预计在2018年可达到1,379亿美元的产值, 这也驱动了消费者对于运算效能的需求.
据悉, Cortex-A76是基于Arm旗下的DynamIQ技术打造, 和去年所发布的Cortex-A75相比, 提升了35%的效能与40%的效率; 可为终端装置上的AI/ML提供4倍的运算效能, 于PC和智能手机上实现快速且安全的体验.
Mali-G76则比前一代的Mali-G72 GPU提升30%运算效能, 以及增加了30%的效能密度, 不仅可满足消费者随时游玩高阶游戏的需求, 也为开发人员提供更多的效能空间, 使他们能编写更多新的应用程序, 为行动应用带来更多高阶游戏, 或是将AR/VR整合至生活当中.
最后, 随着UHD 8K需求逐渐攀升, 为确保IP能支持智能手机和其他装置编码译码运算, Arm便推出Mali-V76, 可支持高达60fps的8K分辨率或四部60fps的4K串流影片, 消费者能同时串流四部4K分辨率的电影, 在视频会议中录制影片, 或者以4K观看四场比赛; 或在较低分辨率的状况下, 仍能呈现高分辨率画质(Full HD), 并能支持多达16部串流影片组成4×4的电视墙.
Project Trillium亮相 加速建构ML生态系
与此同时, 为提升终端装置机器学习效能, Arm也于2018年初发表Project Trillium平台, 包含全新机器学习处理器(ML Processor), 对象侦测处理器(Objects Processor), 以及Arm神经网络软件(Arm NN). 相较于独立CPU, GPU与加速器, Project Trillium平台效能更远远超越传统DSP的可编程逻辑.
Arm副总裁, 院士暨机器学习事业群总经理Jem Davies(图3)指出, 边缘运算发展潜力十分庞大, 目前市面上的确有许多独立的解决方案, 像是ASIC加速器, CPU/GPU等. 终端业者当然可以选择自己想要的方案, 不过缺点在于须花费时间自行进行硬件与软件(TensorFlow, Caffe)的整合.
图3 Arm副总裁, 院士暨机器学习事业群总经理Jem Davies认为, Project Trillium可望为终端装置打造完整的机器学习生态系.
Davies说明, Project Trillium的优势在于, 是以平台的架构呈现, 硬件方面不仅有ML Processor和Objects Processor可供选择, 同时也能透过Arm NN软件, 协助用户简化TensorFlow, Caffe与Android NN等神经网络框架和Arm Cortex CPU, Arm Mali GPU与机器学习处理器之间的链接整合.
Davies进一步指出, 软件整合是发展机器学习其中一个关键要素, 许多加速器业者或许有办法提供相关硬件处理器(CPU, GPU), 但却少有资源可以提供一个完善的平台架构, 协助客户进行软硬件整合或是提升ML模型运算, 而Project Trillium包含全新的Arm IP处理器及神经网络软件, 从硬件和软件面都能满足现今市场需求, 而这种方式也有助于Arm建构完善的边缘运算生态系.
另外, Davies也观察到, MCU对机器学习的需求也十分强劲. 他透露, 在Project Trillium上线, Arm NN软件开发工具包开放用户下载的第一天, 就有超过5,000名用户开始使用CMSIS NN, 尝试以Cortex-M执行机器学习算法.
Davies说, 这个结果其实出乎Arm的预料, 也显示MCU用户群对机器学习的需求跟兴趣, 是不容忽视的. 这也促使Arm决定在未来推出的新版Cortex-M核心中, 进一步强化这类核心执行ML算法的效率.
CMSIS NN是Arm神经网络软件开发工具包Arm NN SDK下的一个运算函式库(Compute Library), 可以提升Cortex-M执行机器学习算法的效率. 即便是现有的Cortex-M核心, 在CMSIS NN的帮助下, 也可以执行一些很简单的机器学习推论, 例如判读传感器输出数据所代表的意义. 当然, 由于MCU的运算效能跟内存空间都不是很充裕, 因此不可能执行非常复杂机器学习推论, 但如果是对单一传感器节点输出的数据做简单判读, 还是有机会实现的.
Davies指出, MCU如果无法支持某些基本的ML算法, AI应用无所不在的未来是难以实现的. 目前透过云端数据中心提供的人工智能应用服务, 其实有很明显的应用局限, 只有把AI不断往边缘推进, 才能让AI应用更加普及. 而为了让MCU能更有效率地执行ML算法, 在Arm未来的产品发展路线图里面, Cortex-M执行ML的效率将会进一步提升.
边缘运算走入自动驾驶 高效能处理器不可或缺
另一方面, 汽车产业未来也将是边缘运算的重点应用领域之一. 根据Arm预测, 至2020年平均一台汽车中将会嵌入多达200多个传感器, 并经由100多个发动机控制器(ECU)或微控制器(MCU)处理, 而如何快速处理如此庞大的数据, 实时做出回应并同时维持系统的稳定性与安全性, 打造符合用户需求的自动驾驶车, 将成为未来汽车电子市场的一大挑战.
对此, Arm副总裁暨嵌入式及车用事业部总经理John Ronco(图4)指出, 边缘运算兴起, 使得终端装置不用再回传大量数据到云端处理, 但这也代表一般的CPU或机器学习芯片需要更高的处理效能, 而这也是Arm推出Project Trillium和Cortex-A76的原因, 而这些产品也相当适合放在汽车电子组件之中.
图4 Arm副总裁暨嵌入式及车用事业部总经理John Ronco表示, CPU, GPU等处理器须具备更高效能才可因应自动驾驶安全需求.
此外, 为实现自动驾驶, 一辆汽车上除了雷达, 光达外, 往往也会搭载视觉传感器, 也因此需要更高的GPU因应庞大的影像运算.
Ronco表示, 自动驾驶的视觉运算需求, 和一般IP网络摄影机差别在于, IP网络摄影机大多是单一的镜头, 且不常移动, 通常是安置在屋内/外某个角落监看. 但对汽车而言, 会须要搭载数个摄影镜头, 侦测路况和环境, 所接收的影像信息十分庞大, 且由于汽车一直在移动, 周遭景物也会跟着不停变化, 这会使得运算更加复杂, 因此便需要完善的解决方案.
Ronco透露, 像是Project Trillium内的对象侦测处理器主要是用于IP网络摄影机, 而要满足汽车视觉运算需求, 则是须靠如Mali-G76这类的高效GPU, 具备更高的运算效能, 才能因应汽车行驶时快速的环境变化, 避免事故发生.
总而言之, AI时代为各项应用领域带来新商机, 而边缘运算也势将会走入汽车产业当中, 但若要将边缘运算建构于汽车中, 必须嵌入更高阶的技术才能达到更优异的性能表现, 使汽车能够更智能, 安全, 有效率.
带动储存需求 WDC具一条龙生产优势
边缘运算兴起, 不仅促使处理器效能须跟着增加, 就连储存需求也跟着攀升, 储存业者因而加速产品布局脚步. Western Digital嵌入式应用解决方案事业部副总裁Christopher Bergey(图5)指出, 边缘运算, 机器学习等技术, 皆让储存和运算变得相当复杂.
图5 Western Digital嵌入式应用解决方案事业部副总裁Christopher Bergey表示, 因应边缘运算市场, 该公司一条龙的生产模式为市场竞争优势.
Bergey进一步说明, 边缘运算会随着不同的应用情境, 对储存产品有不同要求, 像是在汽车上特别重视温度, 可靠性, 在近年来又添加了成本和稳定供货5年的考虑因素; 另外在行动装置应用上, 以智能手机为例, 像是现在消费者对拍照越来越要求, 照片的画素提高, 也连带使得手机储存容量须跟着变大, 边缘储存的需求将跟着变大, 因此相关的嵌入式闪存(EFD)产品性能也随之提升.
因应此一趋势, 像是Western Digital便推出新款iNAND产品系列--iNAND8521/iNAND7550, 采用该公司64层3D NAND技术以及先进的UFS与e.MMC接口, 提供较佳的数据效能与庞大的储存容量. 用于智能型手机与轻薄运算装置时, 这两款产品能加速实现以数据为中心的各式应用, 包括扩增实境(AR), 高解析视讯的撷取, 社群媒体体验, 以及近期崛起的AI与物联网边缘体验.
Bergey透露, 未来行动装置的发展趋势无庸置疑会朝更高性能迈进, 因为5G世代到来后, 传输数据越来越快, 创新应用会愈来愈多, 加上AI兴起, 两者若相结合后, 对工作负载的要求也会随之提升, 储存容量势将会因而大增. 该公司也会持续跟手机业者密切合作, 好针对需求提供合适的产品.
Bergey也指出, 因应边缘运算发展, 该公司其实具备很好的战略优势. 原因在于, WDC具备完整的产品线(从低阶产品到高性能产品), 另外, WDC是采用一条龙的生产策略, 从晶圆, 控制器, 韧体和软件等, 都是自行负责, 因此可以快速的针对市场变化推出产品, 或是满足设备商客制化需求, 这是WDC在竞争激烈的边缘运算市场中所拥有的优势.
NXP携手合作伙伴 加速开发安全边缘方案
至于NXP, 则是从安全着手, 携手生态系合作伙伴, 如新汉, IMAGO, 智邦科技, 神准科技等, 共同投入边缘运算安全基础架构的部署工作, 支持在边缘进行连接的新兴AI和机器学习, 以及部署于云端的安全边缘处理.
协力合作的系统供货商将以NXP的Layerscape与i.MX应用处理器系列为基础, 进行产品开发, 以符合需要本机处理能力与云端联机功能的各种应用上. 开发出的平台提供运算能力, 联机功能及储存容量之间的完善平衡, 适合同时在企业及工业环境运作.
透过NXP的EdgeScale技术及Docker与Kubernetes的开放原始码软件, 可在常见云端架构上执行各种边缘应用, 包括Amazon Web Services(AWS), Greengrass, Google Cloud IoT, 微软Azure IoT, 阿里巴巴及私有云端架构.
NXP指出, EdgeScale是包含装置和云端服务的套件, 透过该产品可以简化安全运算资源在网络边缘的布建; 而NXP将会与这些伙伴共同合作, 为物联网与企业内部部署(On-Premises)的运算平台提供具扩展性, 安全性, 以及部署方便性, 以实现安全部署与管理.
恩智浦数字网络事业部资深副总裁暨总经理Tareq Bustami表示, 建立安全的边缘解决方案对于物联网及工业4.0的成功发展极为重要, 因此, 该公司致力于与众多设备制造商合作, 提供容易使用且支持云端链接的安全边缘运算解决方案. 透过合作, 该公司将协助推出更智能, 更多功能的边缘解决方案, 加入可进行大规模部署及管理的强大安全功能.
综上所述, 可看出不论是IP商, 储存业者或是芯片供货商, 皆积极布局边缘运算市场, 各自开发开放平台与硬件架构, 期能让AI走入各种终端装置中, 并且建构完善的生态圈.