万丈高楼平地起 ——浅谈网格计算基础 |
|
|
|
网格技术的产生、发展必须具备以下三个基本条件:计算资源的广域分布、网络技术(特别是Internet)以及不断增长的对资源共享的需求。在计算器技术发展的早期阶段,只有很少数量的大型计算器,它们通常被安装在相互独立的计算中心内,多个计算器用户透过使用终端来共享一台大型机的资源,但却不能同时共享多台大型机的计算资源。随着网络技术的发展,多台大型计算器可以在局域网(LAN)内互连,用户透过网络便可以同时使用多台计算机的资源。而Internet的飞速发展和普及使得网格计算技术的产生成为可能。图1显示了计算资源共享的发展过程。
系统构成 网格系统可以分为三个基本层次:资源层、中间件层和应用层。 网格资源层是构成网格系统的硬件基础,它包括各种计算资源,如超级计算器、贵重仪器、可视化设备、现有应用软件等,这些计算资源透过网络设备连接起来。网格资源层仅仅实现了计算资源在物理上的连通,但从逻辑上看,这些资源仍然是孤立的,资源共享问题仍然没有得到解决。因此,必须在网格资源层的基础上透过网格中间件层来完成广域计算资源的有效共享。 网格中间件层是指一系列工具和协议软件,其功能是屏蔽网格资源层中计算资源的分布、异构特性,向网格应用层提供透明、一致的使用接口。网格中间件层也称为网格操作系统(Grid Operating System),它同时需要提供用户编程接口和相应的环境,以支持网格应用的开发。 网格应用层是用户需求的具体体现。在网格操作系统的支持下,网格用户可以使用其提供的工具或环境开发各种应用系统。能否在网格系统上开发应用系统以解决各种大型计算问题是衡量网格系统优劣的关键。最近两年,在美国的高性能计算研究领域,网格计算成为非常引人注目的热点。与此同时,企业界也纷纷推出了各自的产品,但到目前为止,仍有相当多的关键技术还有待突破。 三大挑战 网格计算要真正步入实用阶段必须解决以下三大问题: 1.体系结构设计 从第一台计算器出现到现在,计算器体系结构已经发生了一系列变化,经历了大规模并行处理系统、共享存储型多处理器系统、群集系统等各个发展阶段,这些系统的共性是构成系统的资源相对集中。与此相反的是,组成网格系统的资源是广域分散的,不再局限于单台计算机和小规模局域网范围内。网格计算的最终目标是用网上的多台计算机构成一台虚拟的超级计算器,因此,网格系统的体系结构是我们必须首先解决的问题。简言之,网格系统有哪些组成部分、组成部分之间的关系以及如何协同工作是网格体系结构研究需要解决的问题。 2.操作系统设计 伴随着计算器体系结构的发展,计算器操作系统也经历了一系列发展变化,总的发展趋势是如何更高效、更合理地使用计算器资源。网格操作系统是网格系统资源的管理者,它所管理的将是广域分布、动态、异构的资源,现有操作系统显然无法满足这一需求。 3.使用模式设计 网格使用模式解决的是如何使用网格超级计算器的问题。在现有的操作系统上,计算器用户可以使用各种软件工具来完成各种任务。而在网格环境下,用户可能需要透过新的方式来利用网格系统资源。因此,在网格操作系统上设计开发各种工具、应用软件是网格使用模式研究需要解决的关键问题。 研究现状
在国外,最著名的网格计算研究是美国的Globus项目。该项目的主要研究目标有两个:其一是网格技术的研究;其二是相应软件的开发和标准的制定。同时,Globus项目还涉及到网格应用的开发及试验床的建立。最近,Globus项目提出了网格的体系结构模型(图2)。
网格体系结构主要分为以下几个部分: ● 网格结构层(Grid Fabric) 提供资源相关、站点相关的基本功能,便于高层分布式网格服务的实现; ● 网格服务层(Grid Services) 实现资源无关和应用无关的功能,网格服务的实现涉及到地域和机构的分布; ● 网格应用工具层(Grid Application Toolkits) 提供更为专业化的服务和组件用于不同类型的应用; ● 应用层(Application) 由用户开发的应用系统组成,网格用户可以使用其它层次的接口和服务完成网格应用的开发。 我国对网格计算的研究起步较晚,相关工作开始于1998年。由于网格计算是一项刚起步的研究,因此我们在网格计算关键技术的研究方面与国外差距不大,基本处于相同的起跑线上。目前,我国的网格计算研究主要集中于中科院计算所、国防科大、江南计算所、清华大学等几家在高性能计算方面有较强实力的研究单位。这些单位在高性能计算研究方面有很好的技术积累和很强的科研能力。其中,中科院计算所在高性能计算领域的主要成果是曙光3000超级服务器,其它单位的主要成果有银河巨型机、同方探索机群系统等。 从1999年底到2001年初,中科院计算所联合国内十几家科研单位,共同承担了“863”重点项目——“国家高性能计算环境(National High Performance Computing Environment,简称NHPCE)”的研发任务。该项目的目标是建立一个计算资源广域分布、支持异构特性的计算网格示范系统,它把我国的8个高性能计算中心透过Internet连接起来,进行统一的资源管理、信息管理和用户管理,并在此基础上开发了多个需要高性能计算能力的网格应用系统,取得了一系列研究成果。 |