铁流:对于中国超算 外媒只能祭出修改评价标准大法了
日前,关于中国超算的好消息可谓接连不断。
11月14日,在TOP500排行榜上,天河二号和神威太湖之光再度蝉联头两位。
11月17日,由清华大学地球系统科学系副教授付昊桓等共同领导的团队所完成的“非线性地震模拟”获得国际高性能计算应用领域最高奖戈登贝尔奖。
在中国天河二号超算和神威太湖之光超算接二连三取得好成绩的同时,国外媒体和专家的质疑也纷至沓来。那么这些质疑有道理么?
质疑一:使用美国芯片因而是技术含量低的组装货
自天河二号在TOP500榜单上以绝对优势占据第一的宝座之后,就因使用了美国的芯片,有媒体攻击天河二号是“组装货”。
诚然,天河二号使用美国芯片显示出在当时中国的集成电路产业水平相对较低,与美国有较大差距。为了超算的性能不得不选择性能更好的美国芯片。
不过,这并不是贬低天河二号的理由。
超算系统可以分为软件系统和硬件系统两部分。超级计算机硬件系统主要由运算系统、互连系统、存储系统、维护监控系统、电源系统、冷却系统和结构组装设计等部分组成。仅有处理器,是不可能做出世界第一的超算的。
举例来说,同样从美国采购处理器,欧盟自己制造的超算中性能最好的是排在第33位的Mistal,速度为3147.8TFlops/s,仅仅是太湖之光的2.5%。因此,以天河二号采购美国处理器来抹黑攻击,是非常值得商榷的。
值得一提的是,中国在超算芯片上已经实现了国产化替代,神威太湖之光采用了由中国自主设计的申威26010,而天河二号最新的升级过程中,使用中国自主设计的矩阵2000替代了美国超算芯片。在天河二号使用矩阵2000后,超算的峰值性能提升了70%。
可见,在使用了国产芯片之后,天河二号的性能不仅没有下降,反而大幅提升。
质疑二:中国超算是面子工程
在神威太湖之光实现芯片、互联网络、操作系统全部自主研发之后,社会舆论中出现了一种声音,认为中国超算是面子工程。西方要研发更强性能的事情很容易,只是因为没有需求,没有必要研发而已。
然而,这种说法是与客观实际不相符合的。
在天河超算、神威太湖之光超算问世之后,很多欧洲国家都前来寻求合作。
中国计算机学会高性能计算专业委员会秘书长张云泉曾经表示:“世界上很多超算科学家都渴望大机器,当新的项目在旧机器上已经跑不动了,而他们国家的超算发展却相对滞后,所以一旦咱们国家的新机器面世,他们就很迫切地把自己的代码、软件拿过来和中国人一起研制,特别是在不涉军涉密的科学研究上……来自欧洲的超算需求显得很迫切……许多国外的朋友通过邮件找到我,说他们有个应用,希望和太湖之光联合开展研究。还有法国大使馆的科技参赞也专门找到我,希望中法之间签订战略合作协议,让法国的科学家到中国来使用太湖之光,这些合作我们都在落实当中”。
因此,认为中超算是面子工程,国外没有天河二号、神威太湖之光这样的超算是因为没有需求的说法是站不住脚的。
质疑三:中国超算大量计算资源闲置
媒体攻击中国超算计算资源闲置已经不是一两天了。然而,这种说法也是值得商榷的。
早在2016年1月,新华社就报道过《中国超级计算机“天河一号”满负荷运行》,文章中称:天河一号目前已经处于一个满负荷,甚至是超负荷运行的状态,每天在线运行任务超过1400多项,这是欧美国家级超算中心都很难达到的一个业务规模。与天河一号类似,天河二号的的计算资源利用率也较高,不少用户都需要排队等候。在今年年初,神威太湖之光的超算利用率已经到达60%左右。
必须指出的是,超算要时时刻刻保持100%的利用率是不切合实际的。跑计算密集型计算网络会有利用不充分,跑通讯密集型计算处理器也会利用不充分,然后大量计算因为处理问题的特点不能做到负载均衡,加上超算上大部分同时跑非常多任务,所以整体来看总是有计算资源空着,虽然在旁观者看上计算资源没有跑满,但其实写代码的人已经在恨计算资源不够了。这也说明了为什么明明现有超算的计算资源没有跑满,全世界却都在追求性能更强的超算。
对于新建成的超算而言,新超算的用户积累和应用需要一定时间积累。正如新建一条商业街后,商铺进驻、人气积累都需要时间,新超算建成后也要有这样一个过程。神威太湖之光的超算利用率也会随之时间的推移逐步上升。
质疑四:中国超算高分低能
最近,美国电气电子工程师学会(IEEE)高级编辑DavidSchneider发表了自己的看法,认为现在的LINPACK排名标准存在问题,并不能反映真实情况。按照HPCG标准,“神威·太湖之光”仅仅只能排名第五,日本富士通的超算京才是世界第一。
不过,这种观点也是颇为值得商榷的。
首先,LINPACK本身就具有较高的价值。LINPACK指的是矩阵求解,像辐射流体力学、核爆炸模拟、雷达截面的矩量法计算、深度学习算法等很多科学计算模型都包含了矩阵求解。因而是一项非常具有使用价值的测试,并非只能用来跑分。这也是为什么现在LINPACK排名标准依旧是主流的原因。
其次,HPCG标准也存在一定问题。HPCG代表了共轭梯度迭代法的一类应用的计算和通信特征,仅仅代表了某一个方面的特征,并不能涵盖超算的所有特征。而且HPCG本身也是存在缺陷的,还不够成熟,测试受优化的影响较大,这会导致测试脱离实际。这也是为什么HPCG标准没有被业界广泛接受。
最后,用HPCG测试否定神威太湖之光并不可取。评价超算的标准有不少,比如TOP500、Graph500、Green500。而这几个测试各有侧重,TOP500就强调Linpack,Graph500则强调内存带宽和延迟,Green500强调节能环保。而神威太湖之光在TOP500名列第一,Graph500名列第二,其计算性能和通信都已经得到了充分肯定。用一个还未得到广泛认可的HPCG测试去否定神威太湖之光,这种做法有失客观。
质疑五:硬件硬、软件软,中国超算用不起来
在天河二号和神威太湖之光持续数年先后占据TOP500前两位之后,并且在先后在芯片上实现全面国产化之后,一些媒体将攻击的矛头指向了软件。并认为中国超算在硬件上很厉害,但是软件不行,超算用不起来只是摆设。
诚然,在工程仿真领域中,中国的软件和国外还有差距。很多国外软件有的价格特别昂贵,有的软件并行规模受限,有的软件模块国外是禁运的,有一些可以用于军工的软件也严禁出售给中国。但这并不会导致中国超算因为软件问题成为摆设。
举例来说,基于神威太湖之光的两个应用——“非线性地震模拟”、“千万核可扩展全球大气动力学全隐式模拟”先后获得戈登贝尔奖就是最好的证明。
“千万核可扩展全球大气动力学全隐式模拟”在使用24000个主核和136000个从核的情况下,全球范围25公里分辨率的模拟速度可以达到2.81模式年/天。
“非线性地震模拟”则可以实现高达18.9PFlops的非线性地震模拟。这是国际上首次实现如此大规模下的高分辨率、高频率的非线性可塑性地震模拟。首次实现了对唐山大地震发生过程的高分辨率精确模拟,使得科学家可以更好地理解唐山大地震所造成的影响,并对未来地震预防预测等研究具有重要的借鉴意义。
因此,中国超算只是摆设,根本用不起来是无稽之谈。
结语
每当中国在高端技术上取得突破的时候,总是会有这样或那样的流言蜚语。而这些诋毁或抹黑中国科技的言论对于迟滞中国科技进步起不到丝毫的作用。在质疑声中,中国超算的研发人员用不断实现技术突破,创造出性能更好的超算。用自己的实际行动回击了来自国内外的抨击。
页:
[1]