超算, 超级计算机, 是所有计算机中运算速度最快, 性能最强的一类, 在科研和军事等尖端领域拥有举足轻重的地位, 是综合国力的体现, 堪称国之重器. 或
许这些高尖端的庞然大物距离我们寻常百姓的生活很遥远, 所以我们甚至无法感知到它们的存在. 但近期一些事件和一些消息则刺痛了很多国人的神经: 美国最新发布 'Summit' 超级计算机在时隔五年之后, 终于从中国的 '神威·太湖之光' 手中夺回 '世界第一超算' 宝座.
what? 我们居然在这么高尖端的领先过美国长达五年之久? 一些小伙伴看到这则消息时或许会有这样的感叹. 没错, 答案是肯定的. 出于好奇, 笔者顺着这条新闻线索在这个陌生的领域找到了很多有趣的数据和有意思的故事, 不敢独享决定梳理出来分享给大家.
借着Summit这个狠角色, 我们先来进行一些科普小知识, 超算究竟拥有如何惊世骇俗的计算能力呢?
Summit超级计算机由IBM主导完成, 整个超级系统由4608台计算节点, 每个节点包含2个22核IBM Power9处理器 (负责协调) 和6个NVIDIA Tesla V100图形处理单元加速器 (负责计算) , 并可提供 每秒高达20亿亿次的浮点运算速度峰值!
那么, 该如何理解这个每秒20亿亿次浮点运算呢? 如果以我们常见的笔记本电脑为参照物的话, Summit超级计算机的运算能力相当于100万台笔记本; 假如一个人每秒可进行1次运算, 他需要活到63亿年以上才能与Summit的每一秒运算量相当.
算力惊人Summit自然也是个大家伙, 4608个节点每个都有如冰箱大小, 总重量高达340吨, 它被放置在将近900平米的一个超大房间内, 据称连接这些节点的线缆就有接近300公里的长度.
由于算力惊人自然, 发热量自然巨大, 因此全部采用水冷的散热方式. Summit每运行1分钟, 就需要1.5万升冷却液的流量, 而它消耗的电量足以为超过8000个美国家庭提供照明.
既然我们知道了美国Summit超算的实力不俗, 那么中国的超算水平又在什么段位?
02全球超算排排坐 中国实力并不弱
对于全球超级计算机的排名情况, 全球有一个比较公认的 'TOP500' 榜单, 这是由国外权威的超算专家联合编制, 在全球具有较高的公信力.
在2018年度 '超算TOP500榜' 中, 美 国IBM最新发布的Summit和Sierra已经分列榜单的冠第1和第3名, 而此前蝉联多年榜首的中国的 '神威·太湖之光' 和 '天河2号' 已经下降至第2和第4名的位置.
而如果你仔细查看这个榜单的话, 你会发现他们的排名是按照Rmax (实测峰值) 和Rpeak (理论峰值) 来进行排序. 而对于任何一台计算机而言, Rpeak理论性能更多的是一种参考, Rmax实测性能则显得更为关键, 即使是超级计算机也是如此. 接下来我们将范围缩小至TOP5, 看看这些世界顶级的超级计算机究竟在实力上有多大差距.
全球顶级超算TOP5实力排名
此前榜单的头把交椅由中国的神威·太湖之光把持数年, 美国在五年之后发布Summit, 重新夺回第一个宝座.
从数据来看, Summit的实测峰值比神威·太湖之光高出了31%左右. 由于我们采用实测峰值数据来进行比较, 再考虑到两者创建时间的差别, 因此两者的实际差距其实并非像有些媒体宣称的那样近乎倍数的悬殊差距.
中国超算实力规模依然全球最强
接下来这组数据将会更加有趣, 此前有媒体把TOP500榜单中的所有超级计算机进行了国别的归类, 发现来自中国的超算上榜206台, 比例高达41%.
来自美国的超算上榜124台, 比例是25%, 中美两个超级大国统治了全球超过65%的超级计算机, 虽然个体被美国超越, 但中国超算的规模仍为全球当之无愧的第一.
那么问题来了, 中国如何再次超越美国Summit重夺全球超算性能第一的宝座? 有的小伙伴说堆更多的处理器就好了, 然而真实情况却并非这么简单!
03技术封锁下崛起的中国 '芯' 势力
构建一整套全球顶级的超算系统并非是单纯的堆砌处理器这么简单, 首先要有足够强悍的计算个体芯片, 先进的运算管理技术, 操作系统的支持, 以及足够的财力支持才能够造的出. 当然这一切的背后, 最核心的因素是还要有国家层面的政策扶持, 以及足够的尖端科技人才储备. 所以说, 超算是一个国家综合实力的体现一点也不为过.
国的超算起步比较晚, 但是进步神速, 这和我国高速发展需求和国家政策支持有着密不可分的关系. 中国的天河二号超级计算机曾经6次蝉联世界超算TOP500冠军, 确立了中国在全球超算中的绝对地位.
但是由于天河二号早期使用的是intel Xeon的芯片方案, 引来了一些质疑和非议. 中国超算的快速崛起也使得美国政府在2015年颁布了引发轰动的 '限售' 事件: 美国政府严禁intel等公司向中国四家超算中心出口高性能计算芯片.
国产Matrix-2000加速器替代intel Xeon
2015年美国 '限售' 事件爆发, 中国决定采用国产芯片替代. 直至2017年9月份, 广州超算中心宣布年底前升级天河2号超算系统, 使用国产加速器Matrix-2000取代原本的Intel Xeon Phi加速器. 通过国产芯片升级后的天河2A超级计算机取得了算力翻倍的惊人成绩.
国产Matrix-2000赋予天河2A性能翻倍的
国产Matrix-2000的出现打破了美国的 '技术封锁' , 升级后的天河2A超级计算机的浮点性能从之前的54.9PFLOPS提升到了94.97PFLOPS, 互联与I/O方面性能指标也获得了较大幅度的技术进步.
网络带宽从原来的10Gbps升级到了14Gbps, 延迟从1.57us降至1us, 内存容量从1.4PB升级到了3.4PB, 存储容量从12.4PB升级到了19PB, 带宽翻倍到1TB/s, 而功耗则从17.8MW降至16.9MW, 能效大幅提升.
略带神秘色彩的Matrix-2000芯片是由国防科大自主研发设计, 网传由天津迈创公司出品. 在中国超算白手起家的内忧, 叠加美国 '禁售' 的外患的大背景下, 中国超算凭借自主研发的Matrix-2000实现 '绝地反杀' , 此举无疑可以载入史册.
04唯有坚定完全自主研发才是出路
自中国863计划实施以来, 超级计算系统的研发受到了国家的高度重视, 但由于基础薄弱起步较晚, 在国际舞台中一直受制于人.
美国商务部2015年实施 '禁售' 高端芯片事件爆发, 更是坚定了我国高端芯片自主研发的路线, 并被提升到国家战略高度. 中国目前最强大的超级计算机——神威·太湖之光就是在这样的背景下诞生的.
神威·太湖之光超级计算机安装了40960个中国自主研发的 '申威26010' 众核处理器, 该众核处理器采用64位自主申威指令系统, 峰值性能为12.5亿亿次/秒, 持续性能为9.3亿亿次/秒.
2016年, 国际TOP500组织发布的榜单显示, '神威·太湖之光' 超级计算机系统登顶榜单之首, 不仅速度比第二名 '天河二号' 快出近两倍, 其效率也提高3倍.
申威26010众核处理器采用64位自主申威指令系统, 峰值性能3.168万亿次每秒, 核心工作频率1.5GHz. '神威太湖之光' 里安装有40960个这样的处理器. 使用中国自主芯片制造的 '神威太湖之光' 取代 '天河二号' 登上榜首, 中国超算上榜总数量也有史以来首次超过美国名列第一.
申威26010众核处理器的出现基本实现了对Intel Xeon Phi加速卡的替代. 虽然在单片的性能上仍旧跟Intel Xeon存在性能上的差距, 但是得益于体积和功耗上面的优势, 可使得一个小小的机箱就可放置256个计算节点, 同体积计算性能反杀Intel Xeon Phi.
相比其他国产芯片, 申威则要显得更加低调和神秘一些, 因为申威处理器自诞生之初就背负着军工国防和国家信息安全的使命, 其研发单位总参谋部第五十六研究所 (无锡江南计算技术研究所) 于2003年开始着手设计中国人自己的高性能芯片. 在国家'核高基'重大专项支持下, 申威处理采用自主指令集开发, 且具有完全自主知识产权.
虽然目前我国两台重量级超级计算机 '神威·太湖之光' 和 '天河2A' 被来自美国的 'Summit' 和 'Sierra' 所超越, 但两强交手互有胜负也在情理之中.
据最新的消息显示, 我国 '天河三号' 目前正在积极的研发大众, 并有望在2020年重新夺回第一宝座, 并实现对 '神威·太湖之光' 高达八倍的性能超越. 更加值得期待的是, '天河三号' 有望采用全自主创新设计, 自主飞腾CPU, 自主天河高速互联通信, 以及自主麒麟操作系统.
然而我们必须清醒的意识到, 在芯片领域我们所面临的对手是如此强大, 无论IBM, intel, nVIDIA任何一个芯片公司都具有足够强大的实力.
同时需要特别注意的是, 早在5年前, 美国政府就已经停止为超级计算机项目的赞助拨款. 转而开始大力投资量子计算机的研发工作. 这也是此前美国超级计算机止步不前, 最终被中国一举超越的重要原因.
摆在国产芯片面前的挑战和使命同样重大, 在当前的国际局势下, 唯有鉴定的走自主研发的道路, 彻底摆脱受制于人才是唯一出路.
无论是2020年即将投入使用的 '天河三号' , 还是 '神威·太湖之光' 后续的升级, 在关乎国家经济命脉和信息安全的超级计算机领域, 国产芯片将会愈发壮大, 让我们拭目以待!
某专题片对申威26010的报道