科技频道神十专题
人民网>>科技

对话杰克·唐加拉:世界超算与天河二号

2013年06月18日10:59    来源:新华网     手机看新闻

  • 打印
  • 网摘
  • 纠错
  • 商城
  • 分享
  • 推荐
  •    
  • 字号

6月17日,国际TOP500组织公布最新全球超级计算机500强排行榜榜单,中国国防科学技术大学研制的“天河二号”以每秒33.86千万亿次的浮点运算速度,成为全球最快的超级计算机。时隔两年半后,中国超级计算机运算速度重返世界之巅。

“Competition can be positive!”:An Interview with Jack Dongarra

对话人物:杰克·唐加拉——美国工程院院士,Top500主持人之一,超级计算机基准测试、数值分析、线性代数解算器和高性能计算领域的先驱。美国田纳西大学电子机械和计算科学系计算科学杰出教授,橡树岭国家实验室计算机科学和数学部杰出研究员;白瑞雪——新华社记者。

对话时间:2013年5月28日,长沙“2013高性能计算国际论坛”。

白瑞雪:未来研发百亿亿次级计算机面临哪些挑战?

唐加拉:耗电是核心问题。百亿亿次级计算机能耗惊人,你们这台世界上最快的超级计算机耗电量大概是17兆瓦。17兆瓦是一个巨大的数字。

白瑞雪:巨大到什么程度?

唐加拉:在美国,如果一台机器耗电量为1兆瓦,运行一年的成本是100万美元。而超级计算机只要开着,一年就得花掉2000万美元。

另一个挑战是编程问题。一个人修一座房子太慢,如果增加到10个人,修房子的效率也许可以快上10倍。但是,如果有300万人修这座房子,你要关心的就是他们会不会彼此妨碍了。

这些计算机还有另一个关键问题:太贵了。我们在讨论超级计算时往往想到的是硬件,实际上设备内部还有很多其他东西——软件,运算法则,应用,操作系统,编译器,等等。所有这些都需要钱。

白瑞雪:投入的不平衡可能不仅是某个国家的问题。

唐加拉:没错,最受重视的总是硬件。美国、欧洲、日本都面临这个问题,中国同样如此。改善超算生态系统需要各方努力。

白瑞雪:这两天大家对高性能计算的发展动力谈了不少。在政府决心、技术进步和科学需求以及其他因素之间,你认为哪个因素最重要?

唐加拉:科学需求是最重要的因素。超级计算机是高度复杂的科学构体,就像能够预知未来的水晶球。未来气候变化、星系撞击、药物设计,这一切都可以在计算机上进行模拟。高性能计算让我们能够更深入地观察问题,解析度和结果的逼真度更高,当然,求得结果的速度也更快。比如天气预报。如果计算机很慢,要想知道明天天气怎样,也许得24个小时。那么运算就失去意义了——24小时后你完全可以朝窗外看看天气怎样即可。因此,我们要求计算机速度快、求解精确,这两项指标都得靠高性能运算。

白瑞雪:政府支持也很重要吧?

唐加拉:当然。没有政府支持,别人是很难进行这么大规模投入的。政府通常会对什么样的科学最重要进行排序,对重要科学投以经费。

看看我们的Top500榜单上的机器及其用途,很有意思的一点是,它们中大约一半机器都用于产业界,而不是实验室或大学。它们的使用者是那些有模拟或预报需求并进行运算的公司。这些公司深知高性能计算机的重要性。他们明白,买下这些机器就有了竞争优势。因此,高性能计算机已经超越了通常的科学需求,他们被广泛用于产业界并发挥了积极作用。

白瑞雪:“大数据”是这几年的热词。人们对大数据的日益重视是高性能计算发展的良机吧?

唐加拉:是的。数据是高性能计算的驱动力,在高性能计算机上运行的几乎每一项应用都有大数据需求,二者不可分。高性能计算离不开大数据,大数据以及怎样解决大数据带来的一系列挑战,同样离不开高性能计算。今天越来越多的人乐于谈论大数据,其实大数据背后仍然是高性能计算。

白瑞雪:我听说你在Ipad2上运行Linpack,速度相当于1985年世界上最快的超级计算机Cray2。

唐加拉:过去30年发展惊人。高性能计算机的性能每10年提高1000倍,这给我们的工作带来了巨大变化。我手里这台Iphone每秒钟能进行10亿次计算——每秒钟10亿次计算!真是不可思议。当然,今天的超级计算机比Iphone强大得多。

白瑞雪:这在10年前难以想象。

唐加拉:绝对难以想象。更难想象的是10年后会发生什么,10年后的超级计算机又能干些什么。

白瑞雪:如果在高性能计算语境中表述摩尔定律,可以说超级计算机的性能每两年翻一番吗?

唐加拉:我们从广义上将摩尔定律表述为:计算机芯片的性能每18个月翻一番。看看Top500榜单的变化你会发现,超级计算机的性能其实是每14个月就增加一倍,比摩尔定律预言的更快。这是计算机采用了并行处理的结果。

白瑞雪:这个周期将来还可能进一步缩短吗?

唐加拉:不太可能了。总是有尽头的。我搞计算机设计的朋友们认为,至少在未来10年,摩尔定律还将继续有效。

白瑞雪:2010年天河一号成为世界上最快的计算机时,媒体称之为黑马,你则认为它是对美国的警示。如果天河二号下个月真的成为全球最快的计算机,这一次你怎样评价它的成功?

唐加拉:这台机器令人印象深刻,又是一项创新性进步,也许就其投入而言对美国仍然是一种警示。2001年中国在Top500还榜上无名,而今天中国的机器保有量已达到世界第二,实在是令人震撼的变化。此外,天河二号选择了英特尔产品作为主要处理器,但机器内部的互联技术是中国自己的。中国计算机越来越多地采用中国技术,这对美国来说也是一种警示。这表明,高性能计算的发展提升了中国的竞争优势,中国政府正在对这一领域竭尽全力加以投入。

白瑞雪:天河二号为什么这么快?诀窍在于互联技术吗?

唐加拉:高速互联是必需的。大量处理器是计算机速度的基础,但怎样把它们连接在一起同样重要,需要速度很快的互连技术,需要高超的编程技术。

白瑞雪:2010年天河一号夺冠的时候,它是Top500中唯一用GPU作为加速器构建混合结构的机器。而从2012年11月的榜单来看,23台千万亿次级机器中有6台都是混合结构,其中4台用了英伟达的GPU。就方法论而言,这可以说是中国机器带给世界高性能计算的变化吗?

唐加拉:混合结构是个老概念,上个世纪70年代就有了。把两台机器连接起来,就是最早的混合机器。今天,随着部件小型化,处理器集成到了芯片上,加速器集成到了主板上,因此我们不再需要连接两台计算机,而是把芯片和主板连接起来构建混合结构。如你所说,天河一号确实是最早这样做的机器之一。混合是大势所趋。我预言,几年后全球最快的10台计算机都将是混合型的。

白瑞雪:在世界超算领先阵营中,中国这样的新成员加入是否更有利于高性能计算未来的创新发展?

唐加拉:这个领域的竞争非常有益。因为中国的成功,美国也许会警醒从而加大高性能计算领域的投入。或者,日本将此看作他们已经落后的信号,会重新加强高性能计算方面的行动。欧洲同样如此。因此从更广意义上来看,中国的成功有助于推动世界高性能计算进步。

白瑞雪:Top500榜单就像是一场比赛。

唐加拉:我们都想成为第一名。从某种意义上说,这就是场比赛,而我们拥有的计算机就像是奖杯。

当然,怎样使用计算机,才是真正关键所在。我们使用超级计算机是为了更深入洞察科学,发现、探索那些以前在过去无法探索的新事物。每个国家都愿意投入,只是一些国家难以承担巨额费用。在今天的美国,很多工程资金竞争激烈,高性能计算也许不是最靠前的。因此,美国可能无法像中国近年来那样对高性能计算进行持续的资金投入。

欧洲核子研究组织的加速器资金来自多个国家。如果我们也遇到类似情况,也许我们也能够联合各国共同研制计算机,这样将使各方受益。

白瑞雪:那么你看好国际合作前景?

唐加拉:我希望如此。但是,人们为什么不愿意开展国际合作,也许是有很多原因的。超级计算机能干很多事,也能用来提高武器杀伤力。因此我们得小心。美国国家能源部用超级计算机来确保核储备的安全。在这个意义上,超算关乎国家安全。(图片:新华社记者 龙弘涛)

 

(责编:李甜露(实习)、马丽)
社区登录
用户名: 立即注册
密  码: 找回密码
  
  • 最新评论
  • 热门评论
查看全部留言

推荐

资料库

我和神十

微博