[摘要]在全球超级计算机500强名单中,中国的“天河二号”以“六连冠”成就了一个传奇。这一纪录,在2016年6月被终结,而终结者,是同样来自中国的“神威·太湖之光”。澳门新葡亰网站 1时代周报记者
付聪 发自广州

全国产化超级计算机“神威·太湖之光”运算速度夺全球第一

在全球超级计算机500强名单中,中国的“天河二号”以“六连冠”成就了一个传奇。这一纪录,在2016年6月被终结,而终结者,是同样来自中国的“神威·太湖之光”。

中国芯,显神威

这一次,新超算冠军更首度采用中国自主知识产品芯片,完成中国超算界的一大突破。

系统开机1分钟,需全球72亿人用计算器算32年

来源:人民日报 2016-6-21 王伟健 喻思娈 蒋芳 蔡玉高


  6月20日,德国法兰克福国际超算大会公布了新一期全球超级计算机TOP500榜单,由国家并行计算机工程技术研究中心研制的“神威·太湖之光”以超第二名近三倍的运算速度夺得第一。更令人振奋的是,该套系统实现了包括处理器在内的所有核心部件全国产化。

  超级计算机新霸主运算速度到底有多快?全国产化意味着什么概念,中国超算是否已经迈上世界之巅?记者走进负责该系统运营和维护的国家超级计算无锡中心,为你揭开“神威·太湖之光”的神秘面纱。

到底有多快

共有40960块处理器,性能相当于200多万台普通电脑

  系统的峰值性能125.436PFlops,世界第一;

  持续性能93.015PFlops,世界第一;

  性能功耗比6051MFlops/W,还是世界第一。

  国际超算大会上传来的消息光看数据让人不明就里。

  “简单来说,这套系统1分钟的计算能力,相当于全球72亿人同时用计算器不间断计算32年;如果用2016年生产的主流笔记本电脑或个人台式机作参照,‘太湖之光’相当于200多万台普通电脑。”国家超级计算无锡中心主任杨广文介绍。

  走进国家超级计算无锡中心,1000平方米的房间内,记者看到了“神威·太湖之光”的“真身”:

  由40个运算机柜和8个网络机柜组成。每个运算机柜比家用的双门冰箱略大,打开柜门,4块由32块运算插件组成的超节点分布其中。每个插件由4个运算节点板组成,一个运算节点板又含2块“申威26010”高性能处理器。一台机柜就有1024块处理器,整台“神威·太湖之光”共有40960块处理器。

  致力超算研究的意义不仅仅是“速度战”,更重要的是赢得“应用战”。

  国家超级计算无锡中心副主任付昊桓介绍,依托“神威·太湖之光”,以清华大学为主体的科研团队首次实现了百万核规模的全球10公里高分辨率地球系统数值模拟,这一成果将全面提高我国应对极端气候和自然灾害的减灾防灾能力;国家计算流体力学实验室对“天宫一号”返回路径的数值模拟结果令人振奋,将为“天宫一号”顺利回家提供精确预测;上海药物所开展的药物筛选和疾病机理研究,短短两周就完成常规需要10个月的计算,大大加速了白血病、癌症、禽流感等方向的药物设计进度……

  此外,“神威·太湖之光”还在绿色节能方面取得突破。杨广文说,过去超级计算机的用电量堪比一个中小城市,业界因此把能效比作为衡量其先进性的重要指标。“从低功耗、高集成度的处理器设计,到高速高密度的工程实现技术;从世界领先的高效水冷技术,到软硬件协同、智能化的功耗控制方法,‘神威·太湖之光’实现了层次化、全方位的绿色节能。”

究竟有多难

从“玻璃房”到“限售”,25平方厘米的中国芯打破30年技术封锁

  30年前,中国的超级计算机用户有一个神秘的“玻璃房”:美国人把一台超级计算机卖给中国,用不透明的玻璃包裹得严严实实,中国技术人员没有授权不得入内。

  北京师范大学全球变化与地球系统科学研究院王兰宁教授至今记得这个中国土地上的“技术飞地”。“全国只有几个有授权的科学家能够进入玻璃房,而且是在美国人的监视下,一旦程序运行完,机器立即被锁回玻璃房。那个所谓的超算速度,在今天看来充其量是一台高性能电脑,但对于当时的中国来说,却是一个难以企及的高峰。”

  上世纪80年代,我国已逐步迈入独立设计和制造巨型机的国家之列,但却因核心处理器等关键部件与技术的短板只能受制于人,直接导致了我国虽是国外超级计算机“大买家”,却无法拥有匹配的“议价权”。

  步入“十二五”,在国家863项目重点支持下,我国超级计算发展不断取得突破。“天河二号”问鼎“六连冠”的同时,在全球超级计算机500强榜单上,中国制造的名单正越来越长,这引起了美国的警惕。2015年4月,美国政府宣布,把与超级计算机相关的4家中国机构列入限制出口名单,目的就在于通过限售,锁死中国超算快速发展的脚步。

  正是这种封锁带来的激励,让我国下大力气研发全国产化的“神威”系列超级计算机,直至此次登顶国际榜单。

  由此,只有5厘米见方的薄块“申威26010”不仅成为“神威·太湖之光”的心脏,也成为我国自主研发打破30年技术封锁的一柄利器。25平方厘米的方寸之间,集成了260个运算核心,数十亿晶体管,达到了每秒3万多亿次计算能力。

  中科院计算所研究员、并行计算专家张云泉表示,与“天河二号”使用英特尔芯片不一样,“神威·太湖之光”是首次完全用“中国芯”制造的中国最强大的超级计算机。国际TOP500组织在一份声明中写道:“中国在国际TOP500组织第四十七期榜单上保持第一名的位置,凭借的是一个完全基于中国设计、制造处理器而打造的新系统。”

  杨广文说,关于是否应该自主研发核心处理器的争议一直存在,有人说做了这么多年没有做起来,干脆不要做了,“抱养”一个好了。还有声音说,引进、吸收、再创新的高铁模式就很好,为什么非要关起门搞自主生态?“如果没有坚持完全自主生态,没有搞十几年不行,再搞十几年的劲头,不可能有今天核心指标齐头并进的神威。”国家并行计算机工程技术研究中心副主任梁军说。

还有啥短板

应用能力不足,相关软件为国外垄断,中国超算离世界之巅仍有差距

  超级计算机是国家科技综合实力的体现,从高端材料,到生命科学,再到深海探测、空间技术各领域,都离不开超算的支撑。这次好消息一出,有人认为中国超算从此稳稳地屹立世界之巅了。

  真的是这样吗?

  杨广文表示,不可否认,“神威·太湖之光”的成功,标志着我国超级计算机研制能力已位居世界领先水平,但在技术储备、系统稳定性方面与发达国家仍有明显差距。

  速度之争是超算领域最为直接的对决。与“天河二号”“六连冠”的辉煌相比,此次登顶的“神威·太湖之光”要想长期占据世界第一的地位变得异常艰难。去年7月,美国启动“国家战略计算计划”,目标是到2025年建造世界上运算最快的计算机。

  “未来五到十年,从每秒十亿亿次到每秒百亿亿次是超算发展的决胜之地。”国家并行计算中心的相关科研人员表示,虽然超算大国都在进行部署,但其中需要解决的技术关键环节非常多,以能耗为例,“神威·太湖之光”一年的用电量达到15兆瓦,相当于3个清华大学的用电量。以现有技术即使能够实现百亿亿次,能源消耗将十分惊人。

  更为关键的是,无论速度有多快,发展超算始终是为了“致用”,而这仍然是当前我国超算发展的短板。

  中科院计算机网络信息中心研究员张鉴表示,我国利用超算系统解决问题的能力长期不足,相关商业应用软件仍为国外垄断,在软件研制、应用开发和人才培养方面有待进一步提高。将“制好”转化为“用好”,才能真正实现对产业创新与升级的带动。

6月20日,在德国法兰克福举行的2016国际超级计算大会上,公布了最新一期的全球超级计算机500强榜单,中国自主研制的“神威·太湖之光”超级计算机夺魁,这是继“天河一号A”和“天河二号”之后,中国超级计算机再次登顶。

超级计算机,在航天航空、气候模拟、生物信息等诸多方面皆有运用,被誉为中国科技发展的“国之重器”。“超级计算机在政治经济的诸多领域都有很重要的战略意义,可以说是除了理论研究与科学实验,计算是人类认识世界的第三种手段。”中国计算机学会高性能计算专业委员会秘书长张云泉对时代周报记者说道。

就在“神威·太湖之光”夺冠的同一天,国家超级计算无锡中心正式挂牌启动运行,该中心则由清华大学管理运营。中心主任杨广文教授在接受新华网采访时,表示“将围绕江苏与长三角的科技与经济发展需要,发挥清华的学科优势,未来依托这个平台在无锡建设高性能计算机产业园。”

这无疑指明了“神威·太湖之光”未来的产业化道路,此前曾有专家指出中国的超算产业化程度不高,超算有被“浪费”的嫌疑。

“现在目前超级计算机的产业化与商业化确实程度不高,这是因为现在绝大部分的领域都使用不到超级计算机。但超级计算机的技术是会向下辐射的,这能给我们其他商业化的领域带来应用与技术的提升。”中科院计算所研究所博士包云岗对时代周报记者说道。

澳门新葡亰网站 2美国芯片禁售下突围

西蠡湖畔的无锡超算中心,“神威·太湖之光”的本尊就放置在这里。在它占地1000平方米的主机房里,两边整齐地排布着40个黑色外壳的运算机仓,机仓的顶部则散发着代表“科技”的蓝光。

黑蓝色调的主机,性能极其强大。资料显示,“神威·太湖之光”的峰值计算速度达每秒12.54亿亿次,持续计算速度每秒9.3亿亿次,性能功耗比为每瓦60.51亿次,这三项指标均位列世界第一,也使“神威·太湖之光”成功登顶。

清华大学计算机系高性能计算研究所助理研究员翟季冬透露,“这次参加德国的超算大赛,是由清华计算机系的老师负责”。时代周报记者致电清华大学计算机学院,对方透露,参赛的成员则主要是清华计算机学院的研究生。

由清华大学管理运营的无锡超算中心,目前担任主任的杨广文教授是清华大学计算机系高性能计算技术研究所所长,副主任付昊桓则是清华大学地球系统科学研究中心副研究员。

翟季冬是国际超算大赛的常客,2015年,他担任指导老师的清华大学超算团队包揽了三大国际大学生超算竞赛ASC15、ISC15、SC15的冠军。

“在超算的比赛中,一般是考验你超级计算机的应用优化,那次我们参赛,就是在3000瓦功率的限制下,组委会给定一组应用,然后看每个队伍的优化结果,而超算的比赛的准备工作就是优化程序的性能。”翟季冬介绍。

对于超算的考核,张云泉评价道:“实际上对超级机算计考核的指标中,由于峰值一般实际中运算中达不到,最看重的是其持续运算速度与功耗。”

从具体数据上看,“神威·太湖之光”的浮点运算速度为每秒12.5亿亿次,比排名第二的“天河二号”快近两倍,也是全球唯一一台计算速度超过10亿亿次的超算,效率相比“天河二号”也提高了3倍。杨广文在接受新华网采访时打了一个比方—让“神威·太湖之光”开机运行一分钟,就等于全球的人口同时用计算机不间断运行整整32年。正是在这样运算性能的支持下,清华大学地球系统科学研究中心首次实现了百万核规模、高分辨率的地球系统数值模拟。

这样的持续运算速度的实现,源自其众核芯片申威26010。在那些黑色的机仓中,每个机仓都有1024个巴掌大小的芯片,据介绍,单个这样的芯片,其计算能力就相当于3台2000年全球排名第一的超级计算机。这些芯片的研制单位为无锡江南计算技术研究所。

更重要的是,这些芯片全部源自国产,具有自主知识产权。此前的“天河二号”的芯片则是由美国产的英特尔芯片。2015年4月,美国宣布对中国禁售高性能处理器,并特别提到了“天河二号”,称与其有关的中国四个技术中心均被列入美国政府的限制名单。

张云泉告诉时代周报记者,“芯片是电脑的心脏,对于超级计算机来说,更加重要。因为超级计算机运行速度快,对别的国家是一种战略威胁。因此美国很有可能随时掐断这种芯片的供应,因此我们国家必须避免这种情况的发生。”

其他国家没有这样的速度

算上“神威·太湖之光”,这次中国上榜世界超算500强的超算数量,共计167台,首次超过美国成为世界第一。德国IT专业杂志《Heise》网络版对此作出报道时,直接附上了一张中国兵马俑的照片,将中国的超算称为“兵马俑军团”。

而在2001年,中国超级计算机还没有任何一台进入到全球超算TOP500强的名单中去。中国超级计算机的业内还流传着一个“玻璃房子”的故事:20世纪80年代,中国石油工业部物探局花费巨资从美国购买了一台超级计算机,结果这台机器被放在了一个中国人不得入内的“玻璃房子”里,以方便美国专家的监控。

2010年,“天河一号A”横空出世,拿到当年11月世界超算TOP500强的第一名。这也是中国第一次拥有世界上最快的计算机。此后不久,这份榜单每半年一更新,世界上最快的电脑不断易主。

2011年,“天河一号A”就被日本的超级计算机“京”超越。到了2012年6月,美国超级电脑则重夺世界第一的宝座。不过,仅仅时隔一年,中国凭借“天河二号”再次占据世界第一的宝座,并实现了此后的“六连冠”。

中国超算不仅占据了世界第一的宝座,其整体的数量也开始猛增。

2015年5月,中国在全球超算TOP500榜单的仅有37台上榜,半年以后就猛增到109台,超过了欧洲与日本,名列世界第二,国内还成立了国家超级计算中心。如今,又用了半年的时间,就超过美国位列世界第一,国家超算中心的规模也达到6家。排行榜主要编撰人、美国田纳西大学计算机学教授杰克·唐加拉对此评论道:“没有国家有这样的速度。”

澳门新葡亰网站,躺在国家级实验室里

随着技术的进步,中国超算在航天航空、石油勘探、车船设计、新药研发等诸多国家尖端领域都发挥着越来越重要的作用。据新华社报道,基于“神威·太湖之光”系统的3项全机应用已入围国际高性能计算应用领域最高奖—“戈登贝尔奖”,这是该奖项设立30年以来中国团队首次入围。

不过,此后有报道与专家指出,中国超算的短板在于产业化和商业化明显不足。资料显示,“天河一号A”斥资6亿元人民币建成,现在的“神威·太湖之光”,项目的总经费已达17.95亿元。但据统计,国内超级计算机研发经费中用于开发应用软件的尚不足10%,这个数据在美国占比达30%以上。2014年4月,“天河二号”试运行曾对外开放,可最终只有120家企业和研究机构选择试用。

2015年7月,阿里云向外界宣布启动量子计算机的研究计划,其计算速度在未来将超过“天河二号”百亿亿倍。然而,阿里云的公关负责人王子凌对时代周报记者表示:“超级计算机其实我们很难运用到。超级计算机就像是顶级跑车,但我们需要的不是车子跑多快,而是可以提供各种各样的车辆给客户。”

“中国超级计算机的硬件水平已经是世界领先了,但在超级计算机的应用软件开发,与超算的使用人群上,与其他欧美发达国家相比依旧是有差距的。”张云泉评价道。

包云岗对此表示,“现在超级计算机的产业化和商业化在全世界都是一个难题,美国超级计算机也只是躺在国家级实验室里。出于战略考虑,虽然超级计算机的前期投入大,但是我们依旧需要发展超算的技术,它可以向产业的下游辐射,可以产生新的技术应用。并且随着技术的发展,其成本也会下降,就可以在类似谷歌、百度等商业公司的数据库中得到一部分应用。”

相关文章