“使用GPU,我们很容易就可以突破100万亿次、200万亿次甚至更高的Linpack性能,Linpack测试性能值是目前世界超级计算机TOP500排行的标准。”一位从事GPU相关技术研发的负责人这样对记者表示。
超级计算机拥有强大的运算能力,主要原因正是由于采用了最新的GPU产品。据了解,自从NVIDIA发布了基于CUDA运行架构的GPU之后,经过将近4年的时间,GPU已经真真正正帮助到了中国超级计算机产业的发展。在可以想见的未来,GPU加CPU并行运算正在成为一种主流,它帮助各种超级计算机成为科技界的耀眼明星。
解密GPU
要了解GPU,需要先从它的概念谈起。
GPU英文全称Graphic Processing Unit,中文翻译为“图形处理器”。GPU是相对于CPU的一个概念,由于在现代的计算机中,图形的处理变得越来越重要,需要一个专门的图形的核心处理器。GPU使显卡减少了对CPU的依赖,并进行部分原本CPU的工作,尤其是在3D图形处理时。
今天,GPU已经不再局限于3D图形处理了,GPU通用计算技术发展已经引起业界不少的关注,事实也证明在浮点运算、并行计算等部分计算方面,GPU可以提供数十倍乃至于上百倍于CPU的性能,如此强悍的“新星”难免会让CPU厂商老大Intel为未来而紧张,Intel也经常因为是GPU还是CPU谁更重要的问题和业内同行发生分歧。
尽管GPU的概念由NVIDIA提出,但是英特尔、AMD、NVIDIA等都纷纷发表了自己的GPU相关产品和技术。Intel不但是世界上最大的CPU生产销售商,也是世界最大的GPU生产销售商。Intel的GPU现在完全是集成显卡,用于Intel的主板和笔记本,如果只按发售数量计算,Intel随着主板发售的集成GPU已经占据了整个GPU市场的60%以上。
2007年,NVIDIA发布了基于CUDA运行架构的GPU使得这一产品成为一个划时代的符号象征。新产品中,GPU在超级计算机中充当并行计算加速器的角色——通用的X86多核处理器(CPU)负责数据库、操作系统等串行应用,GPU众核处理器则负责高性能并行计算,二者相互配合,从而数倍、十倍、甚至百倍地提高计算效率。
经过4年多的发展,GPU已经成为CPU无法替代的新一代处理器,并大量应用在工业计算和高性能计算机中,它应有CPU无法比拟的优势:具有更强的计算能力和访问宽带;对于CPU有很高的性价比,使用CPU构建同性能的计算机集群,价格至少是GPU的几十倍;运营成本低很多,这主要体现在占地面积小,耗电少(计算机系统本身和空调冷却系统);对环境的影响也比较小,达到相同的性能所需部件和功率都减少了,噪声和辐射相对应的都减少了。
从GPU领域本身来看,CUDA运行架构堪称具有“革命性”——让GPU得以脱掉传统图形处理器的外衣,换上了“专门针对高性能并行计算的众核处理器”的新装。新架构增加了两级缓存,是为了提高GPU的适用面,可以更好的适应数据密集型的应用。在支持的内存容量上,理论上的最大寻址空间可以达到1TB。
目前GPU已经广受计算机厂家们的青睐,据2010年的全球高性能计算机TOP500排行榜,名列第二的曙光“星云”就使用了几千颗Tesla C2050,Linpack性能达到1.27千万亿次每秒!而从SC2010上了解到的信息来看,包括中国的曙光“星云”和中科院过程所的Mole-8.5在内,国际上一共有8个类似的大型超级计算机项目在使用GPU做加速器。
成超算“宠儿”
2011年4月底,中关村的一幢小楼,中科院超算中心主任迟学斌用手中的鼠标进行了几个简单的操作,一个连接昆明、大连、青岛、武汉等超算分中心的实时网络展示在大屏幕上。接下来操作者从自己本地的电脑上传了一个任务文件给超算中心网络,可以清楚的看到这个任务在队列中排列的位置,经过系统的自动甄别之后,任务被分配给了某一家分中心的超级计算机,同时任务所需时间和费用也很清楚的显示给用户的电脑上,这是中科院超算中心的一个实际应用场景。
据迟学斌介绍,中科院超算环境聚合了CPU通用超算能力超过300万亿次,聚合了GPU计算能力超过了3000万亿次,成为实践CPU+GPU运行架构的领先者。
据了解,目前已经落户天津滨海新区超算中心的“天河一号”在全球独创了CPU+GPU融合的并行运算模式,在此之前,“天河一号”凭借1200万亿次的计算能力使我国成为继美国之后第二个能够研制千万亿次超级计算机的国家,其后CPU+GPU并行运算被认为业界的重要趋势之一。
随着强大的计算能力和处理能力被人们逐渐认识,千万亿次规模的超级计算机已经逐渐从科研单位走向社会,作为一种服务,它可以随时随地满足客户的各种任务需求。利用超级计算机强大的科学计算、事务处理和信息服务能力,借助其提供信息服务的强大引擎或平台,整合资源,协同作业,可以解决环境监测、生物制药、污染整治对算法、方程、建模、模拟等复杂计算的需求。
据中科院过程所相关负责人对记者介绍,超级计算在原子结构模拟等方面已经有了实际突破。2009年,全球爆发了大规模的H1N1亚型猪流感病毒流感疫情,这种病毒结构复杂且具有多态性,目前仅能通过电镜观察其粗略外表结构,或通过蛋白质结晶获得单个蛋白质结构,再由X射线衍射等手段检测其三维结构,对于其原子层次结构在体细胞液中的动态变化,则不甚清楚。中科院过程所通过超级计算模拟病毒三维结构在细胞液中的动态结构,体系中包涵原子个数3亿,模拟使用了多达1728个GPU,是目前该类型中最大的模拟,模拟结果对探索抗流感药物研制起到了重要作用。
毋庸置疑,使用GPU做加速器已经成为超级计算机的下一个发展趋势,而通过越来越多的使用虚拟实验和数据分析可以解决现实生活中的各种难题,已经成为超级计算机的一个重要作用。