光子芯片横空出世, 28岁MIT中国青年科学家直取AI算力霸业

英国牛津大学在 2017 年发表了用于计算的光子芯片的研发成果, 其研究人员使用了特殊的相变材料与集成光路, 模拟人脑的神经突触作用, 设计 '光子突触' , 其理论运行速度是人脑的千倍.

实际上, 麻省理工学院的研究团队与合作研究者也有类似的发现, 他们在更早的 2016 年提出了使用光子代替电子为理论基础的计算芯片架构, 由于光和透镜的交互作用过程本身就是一种复杂的计算: 傅立叶变换——利用这个原理, 并使用多光束干涉技术, 就可让相关系寻反应所需要的计算结果. 而这种芯片架构就被该研究团队称为可程序设计纳米光子处理器.

2017 年 6 月, 麻省理工学院研究团队针对可程序设计纳米光子处理器提出了一份论文, 并且发表在《自然-光子》杂志上. 该论文的第一作者及通讯作者, 出生在杭州的沈亦晨目前为 Lightelligence 的联合创始人兼 CEO, 并且是《麻省理工科技评论》所评选出来的 2017年 35 名 35 岁以下中国科技创新青年之一.

光子计算在处理一些 AI 算法时有独特的优势

图丨2017 年《麻省理工科技评论》中国区 '35 岁以下科技创新 35 人' 入选者, Lightelligence 的联合创始人兼 CEO沈亦晨

Lightelligence 目前在沈亦晨的带领之下, 全力研发光学芯片的相关技术, 包含芯片设计, 核心算法, 传输, 周边等, 欲打造一个完整的光学计算生态. 由于 Lightelligence 研发的技术将可能彻底改变计算的生态, 因此获得高度关注, 其中包括将云端计算视为核心发展项目的百度, 以及多位美国半导体行业高管, 都因为看好光子芯片的未来性, 而成为Lightelligence的早期投资人.

沈亦晨对 DT 君表示, 由于其在麻省理工学院博士班的科研项目就是以纳米光子为主, 刚好在 2015 年时, AI 应用快速起飞. 众所周知, 除了数据以外, 硬件对 AI 的应用也是非常重要, 所以开始有了把光子应用在计算环境中的构想.

但为何 2015 年之前没有人想过要把光子效应用来进行神经网络的计算呢? 沈亦晨表示, 这是因为过去神经网络计算并不流行, 而传统的逻辑计算并不是光子计算最擅长之处.

事实上, 光子芯片或许将会是未来最适合用来作为 AI 计算的硬件架构, 这是因为光的特性先天适合线性计算 (AI 计算里最重要的部分) , 这包含了高维度的并行计算. 相对的, 虽然量子计算近来也因为 AI 而受到关注, 但量子计算还是比较偏向擅长解码或搜索的领域, 另外在量产的生态上也还不太成熟, 但潜力却不容小觑.

从传输走向计算, 光子芯片将成终极计算解决方案?

从 2006 年开始, 英特尔推出首款标准 CMOS 工艺的电子混合硅激光器之后, 电和光这两个截然不同的物理现象终于成功被凑在一起. 往后数年, 基于此技术的超高带宽光学传输架构更成为高性能数据中心的最爱, 借此有效降低了大量数据传输造成的系统瓶颈.

2015 年, IBM 研究人员, 发表了针对光子计算的新实验性技术, 通过把硅光子数组集成到与 CPU 相同的封装尺寸中. 硅光子技术的问题一直在于芯片的光学接口, 不过 IBM 的光子解决方案能被应用于系统单芯片 (SoC), 以廉价的标准连接器 (edge connector) 在芯片之间传输光, 或是只要将 CMOS 芯片边缘接在一起就能进行芯片对芯片的通讯.

这些光子芯片的发展主要是作为解决传统芯片与芯片之间, 或芯片与存储系统之间的互连问题. 而凭借集成度高的光子芯片的发明, 取代了过去庞大复杂的光传输架构, 且速度能更快, 延迟更低.

然而, 真正把 '光子' 带往计算领域, 甚至架构成 '光子芯片' 的概念, 却是近两年才逐渐被发掘出来.

由于半导体芯片技术虽依靠新应用与算法的整合, 能做到的事情也越来越多, 但实际上芯片架构本身还是基于同样的逻辑之下, 且受限于半导体工艺, 计算能力, 规模以及功耗, 成本形成难以均衡的四角关系.

这时, 业界也开始积极寻找能突破现况的新计算技术. GPGPU, 神经网络芯片, DSP, FPGA 都在不同的时期被提出来, 擅长解决特定应用计算领域, 但这些芯片并没有解决根本的问题, 也就是其基于半导体结构所面临的物理特性限制.

图丨光子突触作用原理

由 AI 所带起的计算需求不断膨胀, 促进了处理架构持续推陈出新, 譬如英特尔未来将结合 CPU 与 FPGA 计算能力, 借以应对更复杂的应用情境; 英伟达则是在其最新一代的 GPU 方案上大幅强化推理性能. 除此之外, 亦有不少希望能够针对特定计算推出更适合的新架构, 比如说类神经网络芯片 (NPU), 量子计算机 (Quantum computing), 以及最新的计算概念: 基于光子回路 (Photonic Circuits) 的计算架构.

实际上, '光' 被使用在计算环境中已经有超过数十年的历史, 过去主要用以在不同芯片或存储设备间传输数据之用, 而因为相关的传输技术成本太高, 且必须搭配昂贵的周边才能显现出其效益, 也因此, '光' 的传输从没有被普及到消费市场, 导致我们对这个事实没有太明确的认知.

然而, 计算则是另一层次的问题.

图丨SMART Photonics的光子芯片

用很简单的概念解释光子计算芯片, 就是在芯片上使用了无数个光学开关器, 作用就类似半导体芯片中的逻辑栅, 利用不同波长, 相位和强度的光线组合, 在复杂的反射镜, 滤波器以及棱镜结构所组成的数组中进行信息处理.

硅光子和微电子一样, 都是基于硅材料的半导体架构. 而硅作为光学通信传输方面的应用已经相当普及, 由于光的快速反应和并行特性, 能瞬间传输大量数据, 因此被普遍应用在数据中心的服务器上. 也因为光子传输过程稳定, 并行能力强, 且纠错设计相对简单, 传输和转换所需要的能量极小, 所以采用光子计算的架构理论上可以做到相对低的功耗表现. 其次, 光子芯片理论上也能做到规模极小的应用上, 比如说移动设备中.

光子芯片可沿用目前成熟的半导体工艺技术, 而目前仍处于实验阶段的光子芯片仅需要老旧的微米级工艺就可达到大幅超越既有半导体芯片的计算能力, 也因此未来工艺微缩空间极大. 而凭借芯片密度的增加, 性能还能大幅成长, 甚至有机会彻底改写摩尔定律的限制.

沿用 CMOS 工艺是光子计算最大优势, 但目标非取代传统半导体计算

图丨CMOS

沈亦晨表示, 由于光子芯片基本上还是以目前的 CMOS 制造工艺为基础, 相对于量子计算使用的特殊工艺, 在成本或量产技术方面都要更有优势, 虽然目前实验室中的光子芯片在密度上还比不过传统半导体芯片, 但已经比量子芯片好很多了.

而光子芯片的效能取决于架构和算法, 比如说同时使用多少路不同波长的光来进行组合, 或者是在芯片中使用的光学信号的带宽, 以及光电转换时的瓶颈, 但是单从光的物理特性上来看, 在合适的算法上要做到传统半导体芯片的百倍速度是不会有太大的问题的.

当然, 理论上光子芯片可以做到规模很大, 也可以做到很小, 但因为光不适合做非线性运算, 另外光芯片的集成度和尺寸还是会有一定的规范, 要完全取代半导体芯片还是有很大的难度.

从芯片, 算法到周边的生态正在发展中

沈亦晨强调, 目前 Lightelligence 的光子芯片发展已经完成实验室阶段的展示, 在算法, 总线以及存储方面都有相对应的设计正在进行, 当然, 计算芯片最重要的还是生态, 这点也需要更多科研机构和公司加入到扩展光学计算这一领域来共同建立.

因为主力产品是芯片, 所以核心部分在于算法和硬件的结合, 以及相对应的芯片指令以及编译程序, 而 Lightelligence 的工作就是要让开发出来的芯片可以应用到目前市场上流行的框架中, 比如说 TensorFlow, Caffe 等.

另外, 由于光子计算在传输或者是存储有其特殊性, Lightelligence 也在开发相对应的周边设计. 当然, 沿用目前的存储系统虽可加快落地商用速度, 但可能就会限制光子计算的性能表现, 因此这部分未来还是会以搭配针对光子计算优化的设计为目标, 才更能凸显光子计算的整体优势.

如今 Lightelligence 团队正努力改善光子计算的相关生态, 目前当然还不成熟, 不过业界对于高性能计算, 甚至更好的神经网络计算架构有着非常高的期待, 相信其光子计算架构落地之后, 可以大大加速整体 AI 计算生态的变革.

沈亦晨表示, 不论是特定用途, 或者是针对通用计算能力, 这个都会是芯片架构发展的不同过程的选择. Lightelligence首先还是会以技术或应用场景比较成熟的光子芯片应用着手, 然后再逐步去扩大可应用的范围. 同时也在努力开发光子芯片前后端的技术, 为未来不同的计算场景进行更好的适配.

沈亦晨强调, 总体来讲, 在实现光子计算的路上还有很多重大的工程改进需要完成, 但和过去的种种光子计算的尝试相比, 现在可能是最好的时机, 也是最接近实现的一次.

2016 GoodChinaBrand | ICP: 12011751 | China Exports