【赛迪网讯】Top500的第31期已经发布一段时日了,想必大家针对本次TOP500排行榜有了一定的认识。IBM的走鹃超级计算机凭借超过千万亿次的运算能力,荣登本次排行榜的桂冠。通过本次高性能计算榜单的发布,我们从中总结了诸多高性能运算发展的趋势,比如高运算能力、能效至上等,但我们也从中发现我国完全自主的超级计算机并没有上榜。
事实上曙光自主创新的新一代高性能超级计算机曙光5000A凭借Linpack值达到160万亿次的运算能力,完全可以进入榜单,而且可以取得第七名的优异成绩,但因为某些原因而遗憾落榜,不得不说是本次榜单中最大的遗憾。但曙光却认为这个遗憾并不“遗憾”,正如曙光公司副总裁聂华先生所言:“但基于对用户负责的原因,但是正是由于这个排名,我们要看到对用户实际应用的效果”。
近日,曙光牵手AMD公司以及30余家IT媒体和行业媒体在文津国际酒店共同举办了曙光5000A高效能计算机研讨会。通过一种面对面零距离的沟通方式,向在座的各家媒体记者讲述了来自曙光5000A自己的故事。
●完全全自主创新:就像是从黑暗中摸索一样,坎坷的经历,不屑的努力,成就曙光迎来了“曙光”——曙光5000A发布会主持人
记得在曙光5000A的发布会上,小小的停电事故成就了主持人一番慷慨演讲。的确,在服务器产品同质化现象严重的今天,只有坚持自主创新才能形成产品差异化,才能构建竞争优势。而且,经济实力强劲的西方国家一直对高性能计算机的核心技术拥有掌控权,也将高性能计算机作为战略物资对外封锁。以中国为首的发展中国家,只有走自主研发的道路,不断开发自己的高性能计算产品,才能使自己不至于沦为西方国家低性能计算产品的高价倾销地。
尽管曙光5000A在运算能力上从上一代曙光4000A的十万亿次突破达到百万亿次,但在研发百万亿次的过程中所面临的技术瓶颈更是成倍增长,决不是简单的数字的叠加。从体系结构、处理器、互联芯片到组装工艺,从性能提升到环保绿色都有重大创新。
曙光5000A超级计算机的完全自主创新包括主板,体系结构,刀片服务器,刀片机箱系统,网络交换系统,水冷散热系统在内的全部系统。例如首次实现了4路16核的高密度刀片系统;首次实现了单刀片机箱40颗CPU的高密度机箱设计;首次实现了基于DDR的Infiniband的交换结构,实现了20GB高速互联和小于1.3us的低延迟;首次采用了水冷散热系统,降低了高性能计算机对机房系统的要求,降低了系统功耗。这些“首次”的创新设计看起来简单,但实际上都是曙光研发人员凝结的心血。
从曙光针对5000A的宣传中,我们经常会看到一个比较陌生的词汇——HPP体系架构。其实目前高性能计算机主流体系系统并没有HPP这个提法,而是有MPP,有MSP等等,曙光把5000体系结构叫HPP,主要它在体系结构上结合了机群体系结构和MPP体系结构两类结构的优点。它主流的结构是机群,结点机是四路四核的,所以在机群应用角度来说既能够用很大的机群,同时还能覆盖一大块基于UMA架构的,两个结合起来起一个名字叫HPP。
作为一台超级计算机系统,计算单元称得上该系统的核心部分,而整个计算系统的核心当属基于刀片服务器架构的超并行处理系统。曙光致力于开创全新的刀片系统设计,该刀片系统采用7U架构,每个刀片机柜最多支持10片计算刀片。每个刀片计成40个四核AMD皓龙处理器,最高可拥有160核心的高密度设计,是常见1U机架服务器密度的2.86倍,处在刀片行业的先列。同时全自主设计配套模块,遵照中国刀片服务器标准,对结构性的提升、可靠性的提升以及对网络和管理的冗余配置,给客户的使用提供了更大的空间。
在计算单元系统中,不得不谈到胖节点设计。众所周知,高性能计算在进行浮点运算处理的过程中,尤其是需要大量浮点运算时,就会需要包含多处理器的服务器,以完成大规模的计算量。这也就是经常所说的胖节点,胖节点架构有利于性能的提高,因为它采用一种进程/线程间通讯,即胖节点采用CPU间通讯方式,系统将任务队列对称地分布于多个CPU之上,从而极大地提高了整个系统的数据处理能力。而其他架构则采用节点间网络通讯的方式,众所周知并行程序运算的瓶颈在于通讯,过大的通讯延迟将影响运算速度,而胖节点很好的屏蔽了这一点,极大的提高了性能。另外胖节点架构提过对大内存支持,节点中任何一个CPU都可以使用节点内全部的内存,在运行串行程序时,这个程序可以申请很大的内存。同时提供多线程的支持,一个节点中采用多个CPU,这些CPU之间可以进行多线程的并行。
曙光5000A每一处创新的结合最终成就了曙光5000A“四高两低”的特点,这些优势并非一种文字上的夸大宣传,而是给最用用户带来的一种实实在在的益处。正如先前对曙光行业总监任京旸对笔者所说的那样:“四高两低不是说纯技术上的优点,每一高每一低都能转化成用户实实在在受益的地方。从广大用户来讲,大家对高性能计算的需求是无止境的,他会受到客观条件的限制,主观上是需要计算能力越强越好。而且对计算能力的需求是爆炸式的增长,但是有一些客观因素限制,曙光5000A四高两低主要是解决实际应用中的一些困扰。”
1
2
下一页>>