高性能计算机十篇

时间:2023-03-23 15:32:53

高性能计算机

高性能计算机篇1

现代高性能计算机的研制需要投入巨大的人力、物力和时间,对于千万亿次级别的系统,处理器个数将超过10万个,研发费用将达到数亿元人民币,正确的系统设计决策显得尤为重要。由于高性能计算系统研制的主要动力来自用户需求,因此高性能计算机的研制决策必须以是否满足用户需求为最重要的标准,在系统设计时就需要深入分析目标应用特点,以用户需求驱动高性能计算机系统的研制。

用户需求驱动计算机的研制

以目前在TOP500上排名第一的IBM BlueGene/L系统为例。该系统在设计之初就定位于解决大规模分子动力学问题,系统在设计时采用了高并行度、低主频策略。目前的BlueGene/L系统的处理器个数达到13万多个,处理器主频仅为700Mhz。由于分子动力学应用具有良好的并行性,使得系统可以通过多个处理器的聚合计算能力达到较高的整体性能,而低主频策略对系统能耗的降低起到了很好的作用。但是,BlueGene/L显然并不适应所有的并行应用,对于通信频繁或负载不平衡的应用来说,并行度在提高到一定程度之后系统的整体性能反而可能下降,因此可能无法在BlueGene/L这样的系统上高效率地执行。

日本的地球模拟器在2002年~2004年TOP 500上排名第一。该系统在运行实际应用中达到了很好的性能。地球模拟器获得成功的一个主要原因是系统设计者与用户进行了长期合作,深入分析了用户应用。处理器是特制的向量处理器,针对应用提供了极高的单处理器性能,高性能的网络使得系统能够有效处理用户应用的通信需求,使得整个地球模拟器系统对用户应用来说是一个均衡的系统,因此能够得到满意的性能。

高性能计算机的性能评测技术提供了分析用户需求的系统化方法,可以帮助高性能计算机研制单位根据用户应用的需求特点,进行系统的设计和选择,其主要内容包括:

1. 用户需求收集技术,用于分析需求的应用领域,选取有代表性的应用程序。

2. 应用程序特征分析,如该应用的访问特性、通信特性以及并行度特性等。

3. 测试程序构造技术,即根据需求,采用有代表性的程序,并根据需求中各个程序的重要性构建Benchmark程序集。

4. 系统建模和应用程序性能预测技术,可用来比较不同的系统设计方案,分析系统性能瓶颈以及为优化应用程序和系统提供依据。

本文将简要介绍上述技术在国内外的发展现状。

用户需求的收集

用户需求的收集是高性能计算机性能评测技术的基础。用户需求的收集就是通过征集并选取当前有代表性的应用程序来评测高性能计算机系统,典型应用的征集主要集中在对高性能计算需求较大的一些领域。

核武器研制: 国际上的超级计算机很多是用来做核武器研究的,比如美国能源部的ASC(Advanced Simulation and Computing)计划支持的大部分系统、法国的CEA(Atomic Energy Commission)工程。在核武器研究方面有很多大规模并行模拟程序需要运行在超级计算机上。因此,一些公开的核武器模拟并行程序可以作为高性能计算机评测的代码。比如,公开的程序SAGE、Sweep3D等。

国防安全: 这类应用主要是国防上用于密码破译、间谍侦探等方面。这类应用程序主要是信息处理和信息分析,对浮点计算需求比较小,一般对单次计算的响应时间要求比较高。

气象预报: 天气预报是高性能应用的一个传统领域,复杂的气候三维模型对超级计算机有着巨大需求。日本的地球模拟器就是用来做气象预报的超级计算机,我国新一代的数值天气预报系统Grapes就是这类典型应用。这类应用程序对系统的通信性能要求较高。

生物信息学: 通过超级计算机强大的计算能力来解决生物领域的难题是近些年研究的热点。生物领域有很多海量数据处理应用程序,比如基因拼接、多序列比对、蛋白质三维结构预测等,它们都需要使用具有强大的计算能力的服务器来解决。

此外,石油勘探、地震预测、计算流体力学等领域都有着对超级计算机的巨大需求。通过对这些领域的典型应用程序进行征集和初步的分析,我们就可以为下一步的应用程序特征分析做好基础。通过采取广泛征集,在各个领域选择几个候选的应用程序,作为下一步程序特征分析的基础。

应用程序的分析

对选取的典型应用程序进行特征分析是进行高性能计算机性能评测技术的一个关键步骤。只有清晰地了解每个典型应用的程序特征,才可以为下一步的测试程序集构建提供科学的依据。

不同应用领域的科学程序使用的算法不同,对系统的要求也有所不同。比如,通信密集型的算法对机器的网络性能要求较高,计算密集型的算法对处理器性能要求较高。对应用程序进行分析能够让我们了解该应用领域的程序特点,了解程序对系统各部件的不同需求,为用户评测和购买高性能计算机系统提供依据,也能给系统设计者设计相关领域的计算机系统提供参考。对应用程序的分析,主要分析程序的访存特性、通信特性、I/O特性等。

表1是典型的科学应用程序中使用的主要算法描述,其中列举了纳米计算、气象应用、化学应用、聚变、燃烧应用等八个典型科学应用所使用的算法。

对具有多物理、多尺度的科学应用最好在一个通用的、各方面性能都较好的系统上运行; 对于稠密线性代数计算需要高性能的处理器,尤其是具有较高浮点计算能力的机器; 对于稀疏线性代数计算,需要内存的性能较高; 对于多维FFT算法,由于通信较多,需要较高的网络性能; 对于AMR(Adaptive mesh refinement)的应用,需要系统对不规则数据和控制流的性能较高; 对于数据或者I/O密集型的应用,应该需要较好的存储和数据管理能力的机器。

对应用程序的分析,主要包括对程序中访存模式、通信模式、I/O特征以及程序的可扩展性分析。程序的访存模式和通信模式是影响高性能应用程序的两个主要特征,本文下面将重点介绍。

访存特性分析 由于处理器速度和内存速度差异越来越大,应用程序的访存特征严重地制约着并行程序性能提高。通过对应用程序中访存特征的分析,可以帮助优化程序性能。应用程序访存模式主要包括顺序访问和随机访问,可以通过数据局部性来描述程序的访存特征。程序的数据局部性包括时间局部性和空间局部性。

时间局部性: 反映程序中对相同内存地址数据重新引用的趋势;

空间局部性: 反映程序中被引用数据周围地址单元数据被使用的趋势。

例如,程序顺序读取内存地址单元,那么该程序的空间局部性就比较好; 如果程序中频繁地引用相同的数据,那么它的时间局部性就比较好。程序访存的局部性特征是程序的固有的特征,它并不随运行的系统结构改变而改变。因此,可以使用时间局部性和空间局部性作为衡量程序访存特征的两个关键指标。实际上,计算机系统中的Cache也是应用了程序的访存具有时间局部性和空间局部性来设计的。

通过对程序的时间局部性和空间局部性进行量化,我们就可以把不同的应用程序画在一个以时间局部性和空间局部性为坐标的二维坐标图中。图1是一些常见基准测试程序中程序访存局部性示意图,其中横轴表示程序的空间局部性,纵轴表示程序的时间局部性。

其中,HPL、FFT、Random Access和Streams是HPCC(High Performance Computing Challenge Benchmark)基准测试程序集中的测试程序; CG是NPB(NAS Parallel Benchmark)测试程序中的程序; AVUS是一个计算流体力学代码。通过对这张图观察,可以发现HPL和FFT程序具有几乎相同的空间局部性,AVUS和NPB中CG程序具有相同的时间局部性; Streams测试程序顺序的读取内存地址单位,因此程序的空间局部性非常好,但基本没有时间局部性。

通信特性分析 并行程序通过进程间通信、同步完成大规模并行计算,因此程序的通信模式是影响并行程序性能和可扩展性的主要因素。程序的通信模式包括点对点通信和组通信两类。正确理解并行应用程序中的通信行为,对于设计真实的测试程序,优化并行应用程序的性能以及设计更好的网络拓扑结构都具有较好的参考价值。

点对点的通信操作是基于消息传递的并行应用中比较常见的操作,它是在进程间进行点对点的通信。在MPI的应用中,有阻塞式和非阻塞式的两种通信方式。传统的对于并行应用程序的通信可以通过以下几个特征来进行分类: 时间、空间和容量。通信模式的时间特性用来说明消息产生的速率; 空间特性用来说明消息目的地址的分布情况; 消息的容量用来衡量消息大小的分布特征。组通信是由通信库提供的可以实现一对多或者多对多等方式的通信模式,一般在具体实现过程中也是通过点对点通信完成。

对应用的通信模式分析,一般的方法是通过对程序的通信函数部分进行插装(Instrumentation),得到程序的通信事件记录(Communication Event Trace),通过对通信事件分析得到程序的通信模式特征。图2是对国家气象局的新一代数值气象预报系统Grapes程序的点对点通信分析的部分结果,分别描述了消息大小分布和消息目的进程分布的情况。

我们可以发现,Grapes程序中点对点通信的消息大小集中在100KB到1MB之间,0号进程与所有的进程进行通信。Grapes的通信操作较频繁,程序对系统的通信性能要求较高。

通过对程序的通信模式研究,可以把应用程序按照访存特征分别归为不同的类别。此外,程序的特征分析还包括程序的计算特征,如程序以浮点计算为主或以整数计算为主,以及程序的I/O特征、程序中I/O访问的顺序性和I/O访问文件的大小等。

程序集的构建

测试程序构造技术,即根据需求采取有代表性的程序,并根据需求中各个程序的重要性构建benchmark程序集。它需要使用应用程序分析的结果,通过把程序特征相似的程序聚类,并根据应用程序的权重选取代表性的程序,构建最后的基准测试程序。在构建程序集的时候主要从以下几个方面考虑:

1. 程序的重要性。选择典型的应用程序是构建程序集的根本,由于购买的高性能计算机主要用于这些典型的应用领域,所以选择有代表性的应用程序可以和实际的需求更加一致。因此,这类应用在选取的时候具有较高优先级。

2.程序性能特征。通过对程序性能特征的分析,对程序的访存模式、通信模式、I/O特征都有一定的了解。可以通过聚类的方式,使选择的程序集能够覆盖整个性能空间,同时,具有相同或者相似性能的程序,我们可以选取其中的一个作为代表。

3.程序的移植性。由于构建的程序集要在不同的体系结构上运行,所以程序的移植性非常重要。一般针对某个特定领域开发的应用只可在某个体系结构下运行,所以为使基准测试具有通用性,需要把程序移植到各种平台。

此外,基准测试程序还需要考虑数据集以及运行规模等各方面的问题。它是用户理解系统性能最直接的方式,因此在性能评测中是一个极其重要的研究内容。

性能建模和性能预测

通过需求的征集、并行程序的性能分析和最后程序集的构建,我们就构造好了一套用于测试高性能计算机的基准测试程序集。这些测试程序集在用户购买超级计算机以及厂商进行系统比较等方面都具有重要的作用。但这种测试技术不能预测当系统某个设备有轻微改变时系统整体性能的变化,因此无法在系统尚未搭建好的时候,为系统设计人员提供参考建议,也不能对未来的科学应用程序进行预测分析,为面向未来应用需求的系统设计提供帮助。

为了解决这些问题,需要采用系统建模和性能预测技术。性能建模就是对应用程序和高性能计算机系统建立合适的模型; 性能预测就是使用程序和系统的模型,预测应用程序在系统中性能。性能建模和性能预测在高性能计算机系统的性能评测过程中扮演着重要的角色。性能建模和预测的好处在于: 不需要实际运行应用代码就可以分析系统性能,这可以减少运行应用的时间开销,而且在高性能系统还处于设计阶段就可以预测系统性能,及时发现系统设计的瓶颈,分析未来应用模式对系统的需求。

对并行程序的性能预测主要有基于模拟的方法和基于分析的方法。基于模拟的方法主要通过模拟器来模拟系统的Cache、内存、网络、I/O等行为,从而实现系统性能的预测。基于分析的方法主要是对系统和程序建立数学的模型,通过测试等手段获得模型的参数,从而实现性能的预测。

基于模拟的方法又包括执行驱动的模拟器和事件记录驱动的模拟器。执行驱动的模拟器就是仅模拟需要分析的部分,其余的部分通过实际运行。比如,我们需要分析系统的网络性能,只需要模拟通信部分,其他的计算和访存部分可以通过实际运行代码来实现。典型的执行驱动的模拟器现在有UIUC大学的Bigsim模拟器和UCLA大学开发的MPI-SIM模拟器。这种模拟器一般精度很高,缺点是对于访存密集型的应用程序,很难实现在小规模的机器上模拟。

事件记录驱动的模拟器通过事件驱动模拟器执行。比如事件记录驱动的网络模拟器,它的工作原理是对应用程序的通信模块进行插装,得到程序的通信事件记录,然后把这些通信事件记录输入模拟器。模拟器根据输入的事件以及待模拟机器的通信参数指标就可以预测出程序的通信时间,这类模拟器典型的有欧洲UPC大学的DIMEMAS模拟器。

美国的圣地亚哥超级计算中心(San Diego Super-computer Center,SDSC)提出一套基于模拟的性能预测框架。它们认为,影响并行程序性能的主要因素包括单处理器性能和互连网络性能,因此,需要对单处理器性能和互连网络分别建立模型。单处理器上的性能主要由程序的访存和浮点计算需求决定。互连网络的性能主要由程序的通信模式决定。程序的特征和机器的性能分别进行描述,通过两者之间的映射分别实现程序在单处理器和互连网络上的性能预测,最后实现整个并行程序在超级计算机上的性能预测。

基于分析的方法通过对需要预测的并行程序进行分析,对并行程序的访存、通信建立一个数学模型,通过数学模型进行求解,得到程序的性能预测。美国的劳斯阿拉莫斯国家实验室(Los Alamos National Laboratory LANL)使用分析的方法分析了一些并行应用程序。

比较两种方法可以看出,模拟的方法由于可以精确地模拟系统的行为,因此预测的精度比较高,但缺点是模拟的运行时间一般都比较长。分析的方法优点是可以非常灵活地分析各个参数之间的相互影响,预测时间比较短,成本比较低,缺点是预测精度比较低,同时,对于复杂的应用,分析方法很难构建数学的模型。因此,需要把模拟的方法和分析方法结合起来,才可以实现快速、精确的性能预测。总之,系统建模和应用程序性能预测技术,可用来比较不同的系统设计方案,分析系统性能瓶颈以及为优化应用程序和系统提供依据。

作者简介

郑纬民

清华大学计算机系教授、博士生导师,863高性能计算机评测中心主任。同时还担任中国计算机学会副理事长、中国计算机学会学术工会主任、北京市科技进步奖第八届评审委员会委员等。

高性能计算机篇2

关键词 高性能计算机 管理软件 接口

中图分类号:TP311 文献标识码:A

1基本原理

1.1主要管理功能

高性能的计算机的管理软件,主要是使用IPMI协议,通过对网络的启动以及结合BMC卡来达到对计算机的管理的目的。同时还可以通过Internet网来进行远程的关机,远程的对计算机进行安装系统、检测等操作,这些都是通过Java程序执行存放在指定位置的;linux脚本来实现的。

1.2工作原理

PXE是基于TCP/IP、DHCP、TFTP等Internet协议之上的一种扩展的网络协议,它能够提供网络启动的功能、协议又分为客户端(client)和服务端(server)两端,PXE client存储于网卡的ROM之中,在计算机引导的时候,BIOS能够把PXE client调入到内存中,然后对其进行执行,并且能够显示出命令菜单的操作,经过用户的选择之后,PXE client将在远端的操作系统能够通过网络下载到本地上,并且在本地上运行。

PXE能够通过网络传输来保证其最后橙红的运行,在计算机启动的时候,DHCP server能够给PXE client动态的分配一个IP地址,为了实现这个目的,在对DHCP server进行配置的时候应该增加对应的PXE特有的配置。由于在PXE client所在的那个ROM内部,已经存在和TFTP client,因此PXE client可以使用TFTP client,通过使用TFTP协议来在TFTP server上对其需要的文件进行下载。

在上述的条件下,PXE协议就能够正常的运行了。在这个过程中,把PXE client是需要安装Linux的计算机,TFTP server以及DHCP server是运行在不同的另一个Linux server之上的。并且,配置文件、,Bootstrap 文件、Linux内核以及Linux根目录等都是放置在Linux server 上面的TFTP服务器的根目录之下的。

需要值得注意的是,在PXE Client 正常的工作的过程中,还需要 3 个二进制文件:即

Bootstrap、Linux 内核以及 Linux 根文件系统这三种文件。其中,Bootstrap 文件是可执行的程序,它能够向用户提供一个比较简单的控制界面,并且可以通过用户自主的选择,来进行相匹配的 Linux 内核以及 Linux 根文件系统的下载。

2实现方案

2.1涉及基本内容

目前来看,对于高性能计算机的管理软件使用的是基于Java语言的管理软件,它能够在集机群中使用上面介绍的各种技术来完成需要完成的各项功能,并且与此同时,各个功能都是封装在shell脚本之中的,并且还可以通过使用跨平台的编程的 Java 语言中的进程管理来对shell脚本文件进行调用。在计算机的管理软件的前台,会使用JSP来对Java进行调用。

其中,shell脚本文件的调用过程中,会涉及到网络启动、本地启动和网络安装服务这三种十分重要的技术,它们都可以在Linux的操作系统的环境下把调用的服务写成脚本文件的形式来进行执行,在这样的条件下能够使得对前台命令的调用变得更加的方便。

Java是一种跨平台的语言,因此可以使用这种语言作为编程的基本语言来解决这个系统中对于未来的跨平台的一种管理的设想。然而,如果采用这种方式则会涉及到一个Java 与 Shell 脚本的调用接口问题,但是Java 中的进程管理已经提供了能够对 Shell 脚本进行调用的能力,因此则不存在相关的问题。其中,还会涉及到Java 提供的两个类:即 Runtime 和Process。

3 结论

目前,随着高性能的计算机的逐渐增多,对于高性能计算机的管理软件的研究也逐渐的引起了人们的重视。对于高性能的计算机的管理软件的研究方案,大多数都是在Java程序的基础上进行设计的一种管理软件,本文主要对其基本的原理进行了研究,主要包括涉及到的基本知识、以及其内部的软件构成、软件的结构等进行了介绍。该管理软件的工作原理比较简单,并且解决了对高性能计算机进行远程的管理存在的难点。希望通过本文的介绍,能够起到一定的参考作用。

参考文献

[1] 赖万东,钟理.浅析应用计算机软件辅助化工原理课程设计教学[J].化工高等教育,2012(01):63-65+70.

[2] 陈奇,朱家诚,公彦军.将计算机软件引入机械原理教学的探索与研究[J].合肥工业大学学报(社会科学版),2011(01):145-148.

[3] 向健极.计算机软件开发的基础架构原理分析[J].武汉冶金管理干部学院学报,2014(02):70-72.

高性能计算机篇3

关键词:虚拟主机平台;VMware ESX;高性能计算机;虚拟技术

中图分类号:TP311 文献标识码:A文章编号:1009-3044(2010)18-5065-02

现代高性能计算机应用越来越普及、应用的范围越来越广,各种各样的网络系统,各种硬件和软件资源的规模不断增多,以及随着个人计算机操作水平不断提高,因此对计算机信息系统的管理水平要求越来越高,另外由于人们的工作需要,各种的系统的被引入,导致系统的规模越来越大,各种随之配套的硬件越来越多而且复杂,就会导致计算信息系统的可靠性及安全性不断降低。随着高性能计算机出现及应用的普及,使用虚拟主机平台(VMware ESX)解决上述问题变为行之有效的方法。

目前虚拟技术应用主要在台式电脑和应用服务器上,包括软件应用(如VMware workstation、Virtual PC、Xen和VMware ESX )及硬件应用(如Inter的VT-x、VTi和AMD的Pa-cific技术)。本文主要对虚拟技术软件应用部分虚拟主机平台(VMware ESX)在高性能计算机应用进行探讨,然后对虚拟主机平台的前景进行了分析。

1 虚拟主机平台(VMware ESX)在高性能计算机应用的探讨

目前,国外公司及国内一些事业单位已经开始把虚拟主机平台(VMware ESX)在高性能计算机应用,并取得一定成功,包括实现了:低碳节能、提供数据中心级的高可用性、实现整个虚拟化IT环境的管理、整合异构资源、虚拟化集群管理、实现异地备分。

1.1 低碳节能

一个完善的计算机信息系统应用一般包括OA、WEB、FTP、AD、VPN、E-MAIL、电子图书馆、电子阅览室、网管、防病毒、计费等系统,按管理及使用功能的不同或管理部门的不同,需要设置多台甚至每系统都要设置服务器。应用虚拟主机平台(VMware ESX)我们可以把轻负载应用(如OA及一些基础服务系统等)整合到VMware ESX上。通过利用较少数量的服务器运行同样数量的系统应用程序, 降低设备成本和能耗成本。减少服务器设备本身就可以减少耗电,另外由于硬件设备的减少,UPS损耗和散热空调也会随之省电。另一方面可以节省服务器空间,随着各种系统应用增多,不需要随之大量采购硬件设备,从而达节约能耗,实现低碳节能。

1.2 提供数据中心级的高可用性

虚拟主机平台(VMware ESX)本身的就是一个高可用性的基础架构。当我们将一些系统应用程序放在该虚拟平台上时,它也就具有了高可用的特性。在这样的技术平台下面,我们既可以很好处理故障切换,也可以很好地均衡资源,包括:利用VMware ESX可以实现对各应用系统采用最低或最高或按比例分配 CPU、内存、磁盘和网络带宽共享资源,实现优化虚拟机资源分配。CPU的虚拟化可以提高服务器利用率,不会导致关键服务因缺少 CPU 资源的风险。存储的虚拟化可以利用高性能的共享存储器来集中存储虚拟机文件,各种应用系统从而获得更高的可管理性、灵活性和可用性。网络的虚拟化能实现网络虚拟机与物理机一样的功能。进行生产部署或开发及测试时,可在单个 VMware ESX平台或跨多个 VMware ESX 平台安装来构建复杂的网络。另外具有增强的网卡分组功能。VMware ESX可以为每台网络虚拟机提供内置的网卡故障切换和负载平衡功能,实现了更高的硬件可用性和容错能力。利用网卡分组策略允许用户配置多个活动和备用适配器。同一虚拟交换机上的不同端口组可以使用不同的分组配置,甚至不同的端口组还可以为同一个组选择不同的分组算法。

因此通过使用虚拟主机平台(VMware ESX)的以上功能,可以让出现的故障只能影响到其中一VM,即使出现故障,也可以通过VM转移、重启VM等方法迅速恢复系统的运行。以较低的运行成本提供高级业务连续高可用性保护,同时为关键应用程序提高可用性,同时为了提高了系统的可靠性和容灾能力。

1.3 整合异构资源―平滑迁移

虚拟主机平台(VMware ESX)能够实现将多个操作系统的异构开发、测试和临时环境整合到同一个硬盘上。由于各种信息应用系统的研发公司和研发平台及运行环境的不同,导致产品的使用的软、硬件环境要求不一样,如(只能支持WINDOWS或只能支持LINNIX),VMware ESX平台上可以运行未经修改的 Windows、Linux、Solaris 和 NetWare 操作系统。并能支持64 位客户操作系统,运行以非 VMware 格式创建的虚拟机。虚拟主机平台能够在物理机与虚拟机之间平滑地过渡。比如像OA、WEB这样的一些前端应用,从客户端来看在物理机和虚拟机上的应用效果都一样的。虚拟主机平台升级的时候,虚拟主机平台相应的工具也能够实现平滑的迁移。

部分早年开发的应用系统程序由于开发环境的原因,只能运行在原来的操作系统安装与运行,但随着新式的硬件的出现,需要在新的操作系统支持新的硬件,利用虚拟主机平台能将早年开发的应用程序重新放到新硬件上来运行,实现了系统的平滑迁移。

1.4 实现整个虚拟化IT环境的管理―管理简单

虚拟主机平台(VMware ESX)支持对整个虚拟化IT环境的管理。包括软件和硬件的管理,如使用通用的用户界面来管理 VMware ESX、虚拟机和 VirtualCenter Server,可使用任何支持 SMI-S 的标准存储管理工具监控虚拟存储。使用简单的 Web 界面(以前称作“管理用户界面”或 MUI)管理 VMware ESX。使用通用信息模型 (CIM) 通过 VirtualCenter 或与 CIM 兼容的第三方工具提供监控硬件的状态。

另外通过虚拟机平台上的管理工具,可以很清楚地看到所有的虚拟机的状态,并对所使用的资源进行有效的监控和调配。如果是物理机器,我们并不能保证每台服务器在7x24小时都能连上去,甚至需要购置第三方的管理软件来监控。这些都会增加了系统的复杂性和运行成本。

1.5 虚拟化集群管理

虚拟主机平台(VMware ESX)提供了无与伦比的性能和可扩展性,即使最占用资源的生产应用程序(如数据库、ERP 和 CRM)也能实现虚拟化,因为VMware ESX虚拟技术支持:

1)RAM 超额负载。配置虚拟机内存以使其安全地超出物理服务器的内存,例如,在物理内存为 8GB 的服务器上运行的所有虚拟机的总内存可达到 16GB。

2)支持功能强大的物理服务器系统。能支持规模非常大的服务器系统(包括多达 32 个逻辑 CPU 和 256 GB RAM)实施大规模服务器整合和容灾项目。

3)异构存储阵列。在同一 VMFS 卷中使用多种异构存储设备。

4)灵活的虚拟交换机设置。可以创建端口数在 8 到 1016 之间的虚拟交换机,并且每台主机支持多达 248 个虚拟交换机。并提供4GB 光纤通道 SAN 支持。

因此在虚拟主机平台(VMware ESX)需要增加服务器时都很简单,只需要把服务器连接到机群,并配置好,虚拟主机平台就可以自动地利用这个服务器的资源了。增加虚拟主机平台也同样简捷,复制一份相同配置到相应服务器并做简单的配置就可以正常运行,不需要考虑服务器的异构等硬件因素,缩短了部署时间。

1.5 实现异地备份

在虚拟主机平台(VMware ESX)上,采用EMC Avamar虚拟备份工具正好相配,实现虚拟机异地备份。EMC Avamar Virtual Edition (AVE)是最优秀的重复数据删除技术之一,它是一种源端的全局重复数据删除技术。其特点是,在数据源开始处感知应用,能够针对具体应用数据(例如,Oracle数据库、SQL Server数据库、Word文档、PPT文档、电话录音、流媒体等等)的特点,实现最大限度的重复数据删除,删除率高达300:1甚至更高,从而减少需要备份的负载,提高备份速度,是视可替代传统磁带的数据备份工具。EMC Avamar Virtual Edition (AVE)是一种完全虚拟化的备份和恢复解决方案,通过Avamar 在源位置执行全局重复数据删除的技术与 VMware 虚拟基础架构的高效性结合起来,实现虚拟机异地备份。如果采用物理版本,就等于要多配置一台服务器。为了保证高可靠性,可能还需要购置两套互做支持,以防止硬件故障。而作为软件,Avamar虚拟化版本在可靠性、可管理方面都比在物理机上占优势,备份客户端免费,不限备份客户端数目和类型,可以随时追加备份却不用追加投资。如果采用别的备份方案,至少还要采购一台服务器和一个磁盘阵列,运行成本也会高出许多,另外实现容灾也变得复杂许多。

2 虚拟主机平台(VMware ESX)应用前景分析

虚拟机技术目前在台式计算机的应用已经相当普及(如Virtual PC等在教育和科研体系中的应用),而虚拟主机平台(VMware ESX)的应用还只在小范围。随着现代高性能计算机应用越来越普及,对计算机的信息系统的管理水平要求越来越高,虚拟主机平台(VMware ESX)将作为高性能计算机领域解决新出现的技术问题新的方法。

1)异地备分。提高容灾能力,一直以来,一般企业的关键业务数据只是采用B2D作为备份文件进行简单备份,并且每个系统分散备份,备份副本少,备份管理效率低。为了解决上述问题,可以使用虚拟技术建立本地异机备份方案,在不影响现有架构的情况下实现集中备份,提高数据的安全性和高容灾能力。

2)虚拟化集群管理。虚拟技术提供了无与伦比的性能和可扩展性,能使用多种异构存储设备,为客户端提供统一的系统环境和与物理机上一样的应用效果,为用户的运行成本。

3)提供高可用性的基础架构。由于各种系统的引入导致系统的规模越来越大,各种随之配套的硬件越来越多而且复杂,这样就导致计算系统的可靠性及安全性不断降低。为了提高系统的可靠性和容灾能力,使用虚拟技术可以使故障只能影响到其中一VM,即使出现故障,也可以通过VM转移、重启VM等方法迅速恢复系统的运行。

3 结束语

与台式计算机的应用虚拟技术在现代高性能计算机应用,虚拟主机平台目前只在一些高端用户使用,如银行、证券等行业,这些除了对计算机性能有苛刻的要求外,还必须技术工程人员的对各种系统的熟练程度要求较高。随着高效率的虚拟技术的不断发展以及新硬件对虚拟技术的支持,各种信息系统在虚拟主机平台应用是一个需要不断探讨的问题。

参考文献:

[1] 萨曼达.信息存储与管理:数字信息的存储、管理和保护[M].北京:人民邮电出版社,2010.

[2] 钱磊,李宏亮,谢向辉,陈左宁.虚拟化技术在高性能计算机系统中的应用研究[J].计算机工程与科学,2009,31(A1).

高性能计算机篇4

 

高性能计算应用对计算节点内存的不均衡需求导致计算节点之间内存利用率差异较大,为充分利用高性能计算机的内存资源,为缓解这一状况,产生了基于计算节点空闲内存构建分布式内存文件系统的需求。当存储介质从磁盘变为内存,系统服务端I/O性能大幅提高,基于Socket的网络通信成为制约系统性能的主要瓶颈。针对这一问题,本文提出一种基于RDMA的数据传输机制RBP,通过在读、写不同场景下灵活配置和使用RBP,大幅提高了系统的网络传输性能。

 

1 相关工作

 

1.1 MooseFS

 

近年来,大数据、云计算、高性能计算蓬勃发展,分布式文件系统取得长足进步。其中,GFS(Google File System)提出的以大量不可靠的服务器为基础构建高可靠的存储系统的设计思想[1],对分布式文件系统发展具有重要意义。GFS并不开源,因此选择设计接近的开源系统MooseFS[2],其具备支持POSIX语义、易扩展、部署维护简便等特点,包括四个部件:

 

元数据管理服务器Master,负责提供维护元数据,提供元数据服务,管理数据存储服务器等。

 

元数据日志服务器Metalogger,负责备份Master的变化日志文件。

 

数据存储服务器Chunkserver,在Master的调度下,为客户端提供数据传输和存储服务。

 

客户端Client,通过FUSE[3](File system in Userspace)挂载到MooseFS系统。

 

1.2 RDMA

 

RDMA是一种高带宽、低延迟的网络传输控制技术,通过将可靠传输协议固化于网卡,支持绕过内核的数据零拷贝。当前,大多数高性能计算机的计算节点之间采用支持RDMA的网络互连。以TH-1A系统为例,其采用支持RDMA的自主设计的高速互联网络[4]。通过Ping Pong方式测试,计算节点之间的最小单边延迟低至1.57us。通过流水传输方式测试,单向数据传输峰值带宽高达6.34GB/s。

 

1.3 相关研究

 

分布式存储系统的分布式特性决定了其对通信是敏感的,因而往往要求通信能够提供更高的带宽和更低的延迟。鉴于RDMA通信在带宽和延迟方面的良好特性,研究人员在如何利用RDMA通信机制改进分布式存储系统网络性能方面做了很多工作。如N.S. Islam、M. W. Rahman等人为改进HDFS(Hadoop Distributed File System的写性能,在HDFS客户端增加Java适配器,以便借助UCR(Unified Communication Runtime)提供的功能使用RDMA进行通信[5]。Christopher Mitchell、Yifeng Geng等人设计了一个名为Pilaf的分布式内存键值对存储,根据键值对存储以读请求为主的特点,实现了一个基于RDMA的get操作,用来处理只读的服务请求,可以获得显著的性能收益[6]。显然,在利用RDMA改进分布式存储系统网络性能时,需要考虑分布式系统的特点、部署方式、额外开销等诸多因素。

 

2 MooseFS基于Socket的性能瓶颈

 

MooseFS在处理一个读/写请求过程中,有2个环节涉及实际的数据操作:一是Chunkserver对本地磁盘进行I/O操作,二是Client与Chunkserver之间通过Socket传输数据。当MooseFS部署在磁盘时,Chunkserver中的数据块以EXT4等本地文件系统的文件形式存储在磁盘中;当把MooseFS部署在内存时,则可以借助tmpfs等内存文件系统实现。

 

为对比基于磁盘和内存两种形式,服务端I/O性能和系统I/O性能方面的差异,以写为例进行测试。Chunkserver使用TH-1A部署的Lustre系统作为本地文件系统。实验结果表明,相比基于磁盘的存储形式,基于内存存储可以使Chunkserver的写性能提高数倍,然而对系统整体写性能的提升非常有限。此时系统的性能受到基于Socket的数据传输性能的制约。

 

3 优化方法

 

3.1 基于RDMA的高速缓冲池RBP

 

RBP的原理是预先注册一块或多块支持RDMA操作的内存区,按照系统需求将这片区域划分成不同规格的缓冲块RBB(RDMA Buffer Block)。再根据不同用途,将同样规格的RBB组织成不同的缓冲池RBP,并配合一套专用API,以RBB为单位提供高性能的数据传输服务。

 

(1)RBP的结构设计

 

RBB由描述区、请求区和数据区三部分组成。描述区负责提供RBB进行RDMA通信信息,包括RBB数据区所在注册内存区的端点信息、数据区偏移、大小等。请求区负责提供传输控制消息,包括Socket连接描述符、请求类型、请求数据偏移、大小等。数据区负责提供位于注册内存区的存储空间。在利用RBB进行RDMA通信时,RBB需要在通信两端成对使用。

 

RBP,即RDMA缓冲池,RBP的基础是一个由RBB作为元素的双向链表,此外还包括RBP所包含的注册内存区数组,用于进行RBB管理的计数器,互斥量,条件变量等。

 

(2)RBP的使用方式

 

RBP的使用方式分为显式和隐式两种,显式使用是指使用者在RBP创建好后就分配得到全部的RBB,此后由使用者自行管理,适用于用途明确且管理简单的情形;隐式使用是指使用者在需要时从RBP分配RBB,使用完后再将RBB释放,由专门的RBP管理模块进行管理,RBB分配与释放对使用者是透明的,适于用作临时用途的情形。一次基于RBP完整的RDMA通信可以分为三个阶段:

 

数据准备,本地节点将数据写入到分配的RBB数据区中,并向远程节点发送控制消息。

 

数据接收,本地或远程节点根据控制信息通过RDMA操作读/写RBB数据区中的数据。

 

资源释放,本地和远程节点释放此前分配的RBB。

 

3.2 读优化

 

(1)增加特定的读RBP

 

Client的每个读请求都会被分配1个数据区,于是为Client增加了一个64MB的Req RBP,其RBB大小等于Chunk大小,设为4MB,用于提供读请求的数据区,从而绕过临时数据缓冲区,直接利用RDMA通信从Chunkserver读取数据。但是,Req RBP中RBB较大,限制了其数量,无法满足多线程下大量请求对数据区的需求。于是Client增加一个作为临时数据缓冲区的Read RBP,与Req RBP互为补充。为配合Client的RBP,Chunkserver增加一个作为临时数据缓冲区Read RBP。两端Read RBP的RBB大小均与CB相同,设为64KB。此外,读优化中的RBP都是隐式使用,因此两端都需要RBP管理模块。

 

(2)引入连续读流水线

 

RBP对RBB的分配和释放非常灵活,完全可以利用一个RBB准备数据,另一个RBB向Client提供数据,因此,在Chunkserver的读服务线程中对采用RMDA进行连续读的情形引入了流水线。

 

(3)设计多通道策略

 

为了充分利用Client端Req RBP和Read RBP两个RBP的性能,增加了策略控制。当读请求的接收区大小超过1MB时,首先从Req RBP分配RBB作为数据区,若分配失败则继续采用原有的方式分配内存。由于传输非连续小数据时更适合采用Socket。因此,Chunkserver在提供数据时决定采用哪种通信方式,当要传输的数据小于32KB时,采用Socket通信,其他情况,采用RDMA通信。基于以上策略,读请求的数据传输有3条数据通道。如图1(a)所示,通道①②都通过RDMA读取数据,通道①为Client采用Req RBP接收数据,通道②为Client采用Read RBP接收数据;通道③通过Socket读取数据。

 

3.3 写优化

 

(1)增加特定的写RBP

 

Client已存在一个用于提高写性能的Write Cache,于是增加一个显示使用的Write RBP,将Write RBP与Write Cache进行合并。为实现合并,Write RBP的大小与Write Cache设置保持一致,在初始化Write Cache时,每个CB都会绑定一个从Write RBP分配的RBB。同时,Write RBP初始化后由Write Cache进行管理。

 

为配合Client增加的Write RBP,Chunkserver增加一个Write RBP作为临时数据缓冲区,其RBB大小等于CB大小。Chunkserver的Write RBP与Read RBP均由RBP管理模块进行管理。

 

(2)设计多通道策略

 

出于和读相同的考虑,写同样支持RDMA和Socket两种通信方式。不同的是,由Client端在将CB写入ChunkServer前决定采用哪种通信方式。因此,写请求的数据传输会存在2条数据通道,如图1(b)所示,通道(1)通过RDMA写入数据,通道(2)通过Socket写入数据。

 

4 性能评测

 

(1)测试环境

 

硬件环境:TH-1A系统,6个计算节点,1个作为Master,4个作为Client,1个大内存节点作为Chunkserver。

 

软件版本:MooseFS3.0.73,IOR2.10.1。

 

测试方法:测试文件大小为2GB,块大小从16KB到4MB不等,采用直接IO模式进行顺序读、写测试。

 

(2)测试结果与分析

 

客户端对比测试在1个Client下进行,分别采用1、2、4、8个进程进行并行读写,以测试单个客户端的整体性能。测试结果如图2所示,在相同文件块大小和相同进程数时,改进后系统的顺序读写速度全面优于原系统。读速度最大可达到原系统的2.02倍;写速度最大可达到原系统的2.63倍。此外,当原系统进程数从4个增加到8个时,已无明显提升,说明接近基于Socket通信下的性能上限。但对于改进后系统,读块大小超过64KB的文件和写块大小超过512KB的文件,速度依然随进程数增加而稳定提高。

 

服务端对比测试在1个Chunkserver下进行,采用4个Client,每个Client采用单进程进行并发读写,以测试单个服务端在顺序读写时提供的聚合带宽,测试结果如图3所示。改进后系统的单个服务端在顺序读时,向4个Client提供的带宽最大可达到原系统的2.04倍;顺序写时的带宽最大可以达到原系统的2.35倍。而且顺序写时的带宽最大值为4.42GB/s,占到计算节点之间RDMA通信最大单向带宽的接近70%。

 

5 结束语

 

本文提出一种基于RDMA的数据传输机制RBP,在MooseFS原有控制流程的基础上,采用多种切实有效的设计,使其在RDMA网络下的数据传输性能得到大幅提升,但对小数据和多进程的支持还存在改进空间。下一步考虑结合数据预取、写合并、最小匹配等技术,使RBP具有更全面的性能表现和更广泛的应用前景。

 

作者简介

高性能计算机篇5

关键词:高校计算机教学;实践创新能力;重要性;有效策略

中图分类号:TP3-4

在当前知识经济背景下,高校人才培养的模式已经由知识型人才逐渐向复合型人才转化,学生实践创新能力的培养在这一教育教学过程中显得尤为重要。以高校计算机教学为例,其课程教学本身的实践性为学生实践创新能力的培养提供了可能,对于学生全面综合素质的提升也大有裨益。计算机教学随着信息技术的发展处于不断变化之中,理解教学内容是其次,让学生真正掌握计算机专业的学习方法才是关键所在,这对培养学生的综合实践能力、拓展学生的创造性思维等都将产生极其深远的影响。

1 当前形势下学生实践创新能力培养的必然性

随着信息技术的快速发展,高校计算机教学改革成为了计算机专业共同关注的话题。无论是教学环境的构建、教学理念的转化、教学模式的完善,还是课程体系的改进或是考评机制的优化,高校计算机专业本身的实践性正日益凸显,学生实践创新能力的培养成为了高校计算机专业教育工作者的共识。对于计算机教学来说,学生实践创新能力的培养也有着其本身的必然性。

1.1 陈旧的教学理念束缚了学生实践创新意识的发展

高校宽松的教学环境使得不少学生的学习状态逐渐放松和散漫,自主学习的意识无处可寻。在这样一种模糊被动的教学环境下教师的教学理念也停滞不前,计算机专业的教学仅仅是为了考试或是应付各种证书考核。重知识、轻技能的教学理念忽视了学生实践创新能力的发展,教学仅仅停留在理论灌输阶段。

1.2 教学方法的选择欠缺必要的灵活性

对于计算机教学来说,教师教学方法的选择与学生的学习兴趣激发密切相关,也是实践创新意识发展的重要基础。然而当前教师在教学方法的选择上却鲜少从学生的兴趣培养出发,在方法选择上欠缺了必要的灵活性。现有的教学手段显得极为枯燥和乏味,课堂教学中师生的交流与互动也甚少涉及。

1.3 教学内容的设置与时展格格不入

在教学内容的安排上,往往仅仅是从理论教学的角度出发,向学生灌输大量的计算机理论基础知识,关于实践教学的内容几乎没有安排。理论学习的乏味与重复不断的练习操作严重压制了学生学习兴趣的提升,实践课程和案例教学的缺失显然是当前高校计算机教学中亟待改革的重要内容。

1.4 单一僵化的考评机制难以体现实践性原则

在高校计算机教学的考评机制设置方面也难以体现课程设计中的实践性原则,过分强调了书本理论性知识在考试中的重要作用。考试内容大多涉及相关计算机应用原理、概念分析或是程序编排等,忽略了对学生实际问题解决方面的考查,学生的实践创新意识很难在考试过程中得以体现。

1.5 缺少必要的课程实践机会

在日常教学过程中,缺少必要的课程实践机会也是造成学生实践创新意识停滞不前的重要原因之一。计算机专业学生在毕业后很难找到适合自己的工作岗位,被市场竞争所淘汰,难以适应社会的发展趋势,这与学校实践课程的缺乏有着密切关系。不少学生的毕业设计都流于表面,缺少必要的实践素材,学生的自主学习与创新意识难以得到真正发挥。

2 高校计算机教学中培养学生实践创新能力的有效策略

高校计算机教学中学生实践创新意识的培养应立足于教师教学理念的转变,进而不断完善自我教学模式,提高自我教学水平。此外,学生实践创新意识的培养还是当前高校计算机教学改革的必然发展趋势,是素质教育理念与发展模式下的有效改革路径,对于新时期复合型人才的培养势必将产生积极而深远的影响。针对当前高校计算机教学在学生实践创新意识培养方面的不足,笔者认为可从如下几方面加以改善:

2.1 从实践创新培养的角度完善教学理念的重建

当前高校计算机专业教学理念的构建应从实践创新的培养角度出发,重视对于学生个性化学习意识和自我学习观念的培养,消除教师的权威性,真正做到以人为本、与时俱进。除了理论知识的灌输,更多的应体现为对于学生实践应用能力的培养,充分肯定学生的个性发展,鼓励学生大胆创新。

2.2 从人性化角度体现教学手段的多样性

在高校计算机专业教学手段的选择上,也应注重从人性化的发展角度强调教学方法的灵活性处理。教学方法的选择是服务于最终的教学效果,在方法的选择上不必拘泥于形式,多媒体教学用具的辅助、社会实践课程的指引对于学生来说都是激发兴趣的有效途径,教师应从不同角度完善自我教学方法的选择。

2.3 在实践创新能力培养的基础上合理安排教学内容

关于教学内容的设置与安排,也应体现出必要的时代气息,注重学生实践创新意识的培养。教学内容的选择应与学生的自主创新能力发展相适应,减少理论灌输的内容,加大实践课程的引导。此外,必要的课外知识导入也是极其重要的,这在拓展学生知识领域的同时对于学生创新能力的发展也有积极的指导作用。

2.4 实现考评机制的个性化与合理性建设

单纯注重理论考核的计算机考评机制束缚了学生个性化思维的拓展,对于体现计算机课程本身的实践性和应用性也产生了一定的阻碍,实现个性化的计算机考评模式尤为重要。适当增加操作类试题的考核比例,这在训练学生扩散性思维的同时也是对实践创新能力的一种提升。

2.5 在课程实践过程中提升学生的自主创新意识

实践教学的环节是当前高校计算机专业教学过程中所普遍缺少的。实现计算机教学的有效变革正是应当从实践教学的角度出发,提升学生的自主创新意识,在社会实践过程中提升自身对于真实企业环境的感知,为今后的顺利就业打下扎实的理论与实践基础。

3 结束语

对于高校计算机教学来说,“教无定法”的原则也同样适用。这主要是由于计算机教学的内容可能随时发生变化,而掌握知识的方法却是有规律可循的。从学生实践创新能力的培养角度出发,高校计算机教学应切实做到以人为本,在科学发展观的指引下不断完善自身的教学理念,创设出具有时代气息的计算机教学氛围。在新教育教学思路的指引下,促进学生实践创新意识的形成和发展,实现高校复合型人才的培养目标。在有效教学目标的指导下,教师应体现出教学手段的多样化,形成科学合理的教学体系,优化课程考评机制的构建,力求在良好的教学环境下促进学生实践创新能力的发展。此外,足够广阔的学习空间创设也是极为重要的,这不仅是自我教育开展的基础,同时也是创新型人才培养的有效途径。

参考文献

[1]王慧敏.计算机教学中学生创新能力的培养[J].中国现代教育装备,2011,02.

[2]柳永念.创新教育观下高校计算机基础课程教学模式探讨[J].教育与职业,2008,36.

[3]皮晓虹.如何在计算机教学中培养学生的创新精神和实践能力[J].中国科技信息,2008,14.

[4]蔡金龙.在计算机教学中如何提高学生的创新能力[J].考试周刊,2011,02.

高性能计算机篇6

按照2005年11月新出版的《计算机科学技术百科全书》的定义,高性能计算就是“用高速计算机系统解决复杂问题的计算方式”。鉴于这里的“高速计算机”和“复杂”并没有具体的定义,所以高性能计算实际上是一个“相对”的概念。

高性能计算来源于高性能计算机,而高性能计算机的快速发展和摩尔定律有密切的联系。摩尔定律反映了计算机的计算能力随着时间的推移会有指数量级的提高。比如,1993年6月进入世界超级计算机排行榜TOP500的所有500台超级计算机的计算能力之和,只和2005年6月排在最后一位的一台超级计算机的性能相当,况且将500台计算机的计算能力简单相加得到的能力之和,实际上在性能上是根本无法和一台具有相同指标的计算机相抗衡的。这反映出高性能计算机发展的迅猛势头,它也提醒我们在高性能计算领域存在着激烈的竞争和快速淘汰过程。

高性能计算体现国家综合实力

从总体上说,高性能计算的发展水平是一个国家综合国力和竞争力的重要体现,在一定程度上,它的作用和国民生产总值GDP(Gross Domestic Production)的作用可以进行类比。

比如,自从1993年TOP500排行榜建立以来,进入TOP500的超级计算机中美国一直占一半左右,作为世界头号技术和经济超级大国,这充分说明了美国在高性能计算领域的雄厚实力。拿2006年6月的最新统计结果来说,超级计算机拥有量排在前5名的国家分别是,第一名美国占59.8%,第二名英国占7%,第三名日本占5.8%,第四名中国占5.6%,第五名德国占3.6%。中国进入前5名,充分说明了中国近年来在高性能计算领域的飞速发展,也从另一个方面说明了中国在经济上的腾飞。

高性能计算主要服务于两个最终的目标,一个是国家战略高科技,它涉及到国家的长期利益和根本安全问题; 一个是产业高科技,它涉及到国家当前企业的活力与竞争力的问题。

没有高性能计算,美国就没有办法开展核爆炸模拟研究,就无法保持其核威慑,其超级大国的地位就会受到严重挑战。没有高性能计算,就没有中国的两弹一星,就没有中国的载人航天,中国的探月计划也就不可能提到议事日程上来,我国能够在世界舞台上发挥越来越重要的作用,和我国在自主高性能计算技术支持下开展的战略高科技上所取得的成果是密不可分的。

而对产业高科技而言,作用更是明显。比如高精密度的快速计算模拟可以帮助气象服务、航空航天、制造、石油勘探、新材料、新药物等行业节省大量的成本,加快研制和生产周期,提高生产效率,这都是以高性能计算的支撑为前提的。

高性能计算的几个要素

一个国家高性能计算能力的大小取决于以下几个要素: 高性能计算机、高性能计算应用、高性能计算软件以及跨学科高性能计算人才。其中,高性能计算机是依托,高性能计算软件和高性能计算人才是基础,高性能计算应用是目的。

1.高性能计算机

按照TOP500中的分类,目前的高性能计算机主要有如下几种类型:

集群式系统(cluster),这在2006年6月的排行榜中已经占到72.8%;

大规模并行处理系统(MPP),这在2006年6月的排行榜中占到19.6%;

星群系统(constellation),这在2006年6月的排行榜中占到7.6%。

集群式系统具有研制周期短、性价比高、易扩展等优点,已经成为目前高性能计算的主流,这主要得益于它所采用的通用与标准化的技术路线。组成集群式系统的计算结点和互连网络都是通用和标准化的,是直接可以从市场上购买到的,不需要一切从头进行设计和生产,这就直接导致了它具有下面几个优势:

(1) 研制周期短。集群式系统是一种积木块式的高性能计算机构造方式,它的组成部件都是现成的,设计者需要做的就是根据需求和预算,在可选的结点/网络中进行比较、优化和调整,实现快速组合;

(2) 性价比高。以前的高性能计算机因为专业化程度太高、不能大批量规模化生产,导致了高成本和高投入,所以研制的高性能计算机价格昂贵,但通用和标准化部件的采用,一方面大大降低了成本,另一方面,通用部件的计算速度和通信速度都在呈指数增长(通信领域的摩尔定律),这种成本不断降低和性能不断提高的趋势,使得集群式系统的发展势不可挡,很快成为高性能计算的主角;

(3) 扩展性好。集群式系统的可扩展性直接取决于连接该系统的网络的性能和规模,只要网络在保持或者提高性能的前提下可以扩展规模,只需再添加相应的计算结点,集群式系统的性能和规模就可随着提高,因此非常容易扩展。

与集群式系统相比,大规模并行处理系统的研制难度高,周期长,不易扩展,而且一般也比较昂贵,但是它有一个重要优势就是可以取得比同等规模的集群式系统更高的性能。如果说集群式系统走的是一条通用化的路线,则大规模并行处理系统走的就是一条相对专用化的技术路线。集群式系统主要从摩尔定律得到性能的提升,而大规模并行处理系统除此之外还可以从一些专门的系统设计与专门技术上得到性能的提高。这种系统虽然昂贵,但是它能够存在的一个根本原因是有比较专业化的特定需求,因为某些专门的应用领域对计算机系统有特定的需求,比如有些应用需要特别大的共享内存,有些应用有特殊的通信模式,只有针对这些需求设计专门的机器,才能够满足实际应用的需求。

与前两者相比,星群系统走的就是一条中间道路。集群系统连接的是一些比较简单的小计算结点,如果把这些结点进行扩展与放大,达到大规模并行处理系统的规模和性能,然后再用集群的方式连接起来,这就是星群。集群连接的是一些小结点,而星群连接的是大系统。随着高性能计算应用领域的不断拓广,针对不同应用特点的高性能计算机系统会不断涌现,可以预见,将这些不同特点的高性能计算机连接起来的星群系统在高性能计算领域所占的比重会逐渐增加。

2.高性能计算应用

高性能计算所涉及到的应用非常广泛,包括半导体、金融、地球物理学、天气与气候研究、计算流体动力学、天气预报等。根据2006年6月TOP500的最新统计数据,最主要的三个应用领域是工业生产(占51.4%)、科学研究(占23.6%)与高等教育(占16.6%)。

3. 高性能计算软件

不管高性能计算机本身的硬件性能有多高,如果没有合适的软件支持,高性能计算机的功能就根本发挥不出来,也不能用它来有效地解决实际的问题。高性能计算软件包括系统软件和应用软件两大类,系统软件用来有效管理整个高性能计算机的资源,而应用软件是针对特定应用开发的专门软件。

从高性能计算机所采用的操作系统看,目前Linux占绝对优势,根据2006年6月TOP500排行榜的数据,使用Linux的大约占73.4%,使用Unix的大约占19.6%。在操作系统之上,几乎所有的高性能计算机都支持MPI(Message Passing Interface)并行编程环境,不管是Linux还是MPI,都是开源软件,由此不难看出,开源软件在高性能计算软件中的重要性。相信在不久的将来,将会有大量开源高性能计算应用软件涌现,而且在高性能应用软件中所占的比重会不断增加。

4.高性能计算人才

高性能计算要想发挥作用,还必须和具体的应用相结合。在高性能计算机硬件的水平有了普遍提升和大幅度推广的情况下,既懂应用需求,又懂高性能计算知识的“复合”型人才就显得尤为重要,而相对其他方面的人才来说也更为缺乏。因此,高性能计算领域面临的一个重要问题就是“复合”型高性能计算人才的培养问题,尽管它是一个软指标,但是却是发展高性能计算最重要的一个指标。

我国高性能计算的现状

我国在高性能计算领域所取得的成果是十分显著的。在高性能计算机的研制方面,首先是联想率先在2002年研制成功“深腾1800”集群式超级计算机系统,该系统在2002年11月的TOP500排行榜中位居43,跻身前50名,紧接着在2003年联想又研制成功了“深腾6800”超级计算机。该系统在2003年11月的TOP500排行榜中位居14,又跻身前15名。很快曙光研制成功了“曙光4000A”超级计算机系统,它在2004年6月的TOP500中排名第10,我国终于有一台自主研制的超级计算机进入了世界超级计算机的前10名,这是一个非常大的飞跃。清华大学和深圳大学联合研制的“深超-21C”超级计算机系统,在2003年11月的TOP500排行榜中名列163位,它是我国高校自主研制的第一台进入TOP500的超级计算机系统,展示了我国高校在超级计算机研制方面的实力。在短短2年的时间里,在集群式超级计算机系统研制方面我们取得了让整个世界为之震惊的成果。目前我国正在计划研制千万亿次的超级计算机,而目前由IBM研制的最快的超级计算机BlueGene/L 的速度是280.6万亿次。

我国顶尖高性能计算机在TOP500中的名次不断提升的同时,进入TOP500的高性能计算机的数量也在增加,从1995年6月只有1台(而且不是自主研制的),到2006年6月的统计结果已经达到28台,绝对数目虽然不太多,但是和世界其他国家相比,增速正在加快。

我国从1995年到现在,先后建立了近10个国家高性能计算中心,更令人高兴的是,我国众多的科研单位甚至是一些企业也开始建立自己的高性能计算机系统。另外,我国软件行业协会数学软件分会建立了中国超级计算机排行榜,2002年11月第一次排名情况,以后每年的11月一次,第一次只了50台超级计算机,以后数量扩展到100台。中国超级计算机排行榜的,引起了世界相关机构的高度重视,它一方面是中国高性能计算机快速发展的真实反映,另一方面也促进了中国高性能计算机的发展。

然而,与发达国家相比,我们还存在明显不足。

首先从高端技术看,我们的高性能计算机还是以集群式系统为主,这是一种相对比较成熟的技术,门槛比较低。其次,从低端看,我国高性能计算总体的应用水平还比较低,推广普及程度还远远不够,使得我国高性能计算的发展缺乏足够的动力。

从高性能计算软件看,我国的高性能计算机软件特别是应用软件的水平低下,这严重制约了我国高性能计算机应用的效果,而这需要跨学科高性能计算人才的培养以及长期的积累。

从高性能计算的人才看,一方面,我国专门从事高性能计算研究的人才积累不如国外; 另一方面,在跨学科高性能计算应用人才方面,我们国家和国外发达国家的差距尤为明显。 我们的科研人员往往缺乏跨学科的合作意识,有需求的人不知道如何使用高性能计算机,而会使用高性能计算机的人又对需求缺乏深刻的理解。人才的差距是我们和国外发达国家最重要的一个差距。为此,中国计算机学会高性能计算专业委员会在2005年7月30日发出了“关于推动我国高性能计算发展的倡议书”,在倡议书中,呼吁政府加大对高性能计算的投入,各种单位与职能部门密切结合,加大对国产高性能计算机的支持。作为一个专业委员会,它更多关注的是该领域存在的问题,但是只要我们正视这些问题,全社会共同努力,我国高性能计算蓬勃发展的局面就不会是昙花一现,它将逐步走上健康、稳步而快速发展的轨道,为我国的经济腾飞和社会进步做出独特的贡献。

作者简介

都志辉

博士,清华大学计算机系副教授,高性能计算技术研究所副所长,主要研究方向是网格计算与高性能计算,出版了我国第一本介绍MPI并行程序设计和第一本介绍网格计算的图书。

链接:世界主要超级计算机供应商

IBM: 目前的主要产品包括P69X系列、BlueGene 系列以及HPC集群系统,IBM拥有目前排名第一的超级计算机Blue Gene/L系统。

HP: 主要产品包括SUPERDOME系列和HPC集群系统。近年来,HP公司逐渐转向使用通用芯片,如Intel的Itainum 2处理器。

SGI: SGI是一个专注于工程与科学计算的厂商。目前的主要产品包括Altix系列,采用Intel的Itanium 2处理器和Linux操作系统。与其他公司产品不同之处在于,SGI使用Numa-Link的高速互连网络使得整个系统成为一个CC-Numa系统。

CRAY: CRAY是向量超级计算机的代表。CRAY曾一度被SGI公司收购,近年来CRAY又从SGI中独立出来。高速互连网络、可配置的加速器是目前CRAY公司的特色技术。

Sun: Sun公司具有自主的SPARC结构的处理器和Solaris操作系统,SUN公司的SMP服务器占有较大的市场份额。

曙光: 目前主要提供曙光4000系列超级计算机。峰值速度超过10TFLOPS的曙光4000A安装在上海超级计算中心,在世界高性能计算机500强排行榜上曾达到过第10名的位置,是我国自主研制的超级计算机的最高记录。

高性能计算机篇7

 

基于此,本文将具体分析影响计算机网络可靠性的因素,并针对其中存在的问题提出解决的方法,以期有助于提升计算机网络的可靠性,为用户带来更好的网络体验。

 

计算机网络的发展既是机遇又是挑战,在信息化时代,计算机网络的发展为人们的生活带来了便捷,使得信息的交流更加方便,但其中又隐藏着许多不利因素,给网络入侵者创造了机会,难以保证用户的信息安全。

 

针对计算机网络中存在的不利因素有必要采取有效的措施提高计算机网络的可靠性,保证用户的信息网络安全。

 

1计算机网络与计算机网络的可靠性

 

计算机网络主要是一种信息网络系统,通过将不同区域地点的计算机及其外部设备进行连接,实现计算机间信息的交流与传递,做到信息的共享。

 

总的来说计算机网络就是基于当代通信网络发展而来的集计算机、设备统一运行的网络系统,并且随着计算机网络的普及,计算机网络的功能也在不断增加,成为了人们生产生活中重要的信息交流手段,为人们的生活带来了极大的便利。

 

但随着计算机网络的发展,保证计算机网络的可靠信却是一大难题,提高计算机网络的可靠性主要是降低用户在使用计算机过程中存在的风险,保证计算机网络在相关的时间及规定下满足用户的需求,也就是在计算机网络运行的过程中保证用户的信息网络安全。

 

2影响计算机网络可靠性的因素分析

 

2.1网络设备的性能

 

网络设备的性能将直接影响计算机网络的可靠性,网络设备能影响用户终端设备的运行,若这种设备存在安全性因素将直接影响计算机网络的可靠性。在计算机运行中,只有保证用户终端设备的安全可靠性,才能提高网络设备交互的安全可靠性。所以网络设备性能的状况将直接影响信息网络的安全性,直接影响计算机网络用户的上网体验。

 

2.2 网络建设的可靠性

 

网络建设需遵循一定的布线原则,但在实际的网络建设中存在一些不合格的布线方式,影响计算机网络的可靠性。在网络建设中只有按照一定的布线方式才能有效地降低信息网络中的问题,提高计算机网络的可靠性。

 

通常网络建设中使用的是双线的布线方式,这种方式能在计算机网络出现问题的情况下,用切换管理的方法对信息网络予以保护,提高计算机网络的可靠性。此外,计算机网络建设的重点应放在用户终端的数量上,使计算机网络集线器能连接到网络上,提高计算机网络的可靠性。

 

2.3网络管理的影响

 

计算机网络系统往往由不同的单位研发而成的,由此使网络管理中存在大量的不稳定因素,很难根据需要安装一个完全可靠的信息网络系统。

 

同时在计算机网络系统的运行过程中,很可能因为管理不但造成信息的丢失,出现运行故障,降低计算机网络的可靠性。因而对于这种运行系统,在网络运行调试及管理上会存在一定的困难,很难保证计算机网络的可靠性。

 

2.4 网络的拓扑结构设计

 

网络的拓扑结构应根据具体的计算机网络进行规范设计,一旦结构设计不合理将直接影响计算机网络的可靠性。因此在计算机网络拓扑机构的设计中往往需要对照具体的计算机网络拓扑结构图,减少设计中的失误,提高计算机网络的可靠性。

 

2.5 用户操作的影响

 

计算机具有一定的安全防范功能,但用户在使用计算机的过程中由于不当的操作,或网络安全意识低很容易给网络入侵者提供机会,破坏计算机的安全防线。

 

在计算机中一般都具有网络防火墙,用以提高就算计网络的安全可靠性,但这只是基础性地防止网络入侵者,对于用户自身的网络使用却毫无限制,因此用户很可能在无意识的情况下给网络入侵提供了机会。

 

3提高计算机网络可靠性的方法分析

 

3.1优化网络设计

 

在计算机网络的设计中应避免计算机网络冗余造成的故障,所以在计算机网络系统的线路设计上可以采用平行线的设计形式,在计算机的用户终端上设计两个连接点,形成一个双向的连接网络,用以解决计算机网络冗余的问题,提高网络应对故障的能力,避免因网络故障影响网络的可靠性。

 

采用双向的网络结构设计可以提高网络系统的容错性,就是在网络使用的过程中,计算机网络系统的主网络在出现故障的情况下,备份网络会继续工作,保证计算机的数据进行正常的传输及计算机的正常运行。这种容错型的设计能防止因网络故障造成的数据丢失,保证计算机网络的安全运行。

 

3.2 优化网络的整体设计

 

在网络的整体设计中可以采用整体网络体系的设计方案以及层次布局的设计思路。计算机网络一般采用的是集中式网络架构的设计,但为了提高计算机网络的可靠性可以采用分散的网络结构,实现网络内部结构的扩展,减少操作问题的产生,提高计算机网络的可靠性。而层次布局的设计形式能优化网络系统各层次的功能,为用户提供高效的网络体验。

 

3.3 提高网络的使用寿命

 

网络的寿命周期是影响网络可靠性的重要因素,因此在提高计算机网络可靠性的时候应考虑到网络的整体周期成本。在网络系统管理的过程中,建立一个高效的网络系统,也就是在保证网络系统安全运行的情况下,降低成本、提高效率,使网络能保持在最佳的运行状态。

 

3.4 完善网络的监控与管理

 

有效保障计算机网络的可靠性离不开网络的监控与管理,因此在日常的生活中应加强网络的维护与监控。因为计算机网络通常是由不同的网络设备构建而成的,这样的网络系统容易发生故障,造成停机或系统的崩溃,所以要有效地提高网络的可靠性应做好日常的维护与监控工作,及时发现设备运行中的问题。

 

4结语

 

综上所述,计算机网络的可靠性是保证网络正常高效运行的基础,因此在使用计算机网络的过程中应优化计算机网络的整体性能,针对影响计算机网络可靠性的因素进行分析,提高计算机网络的可靠性。尤其是在现今计算机网络普及的情况下,更应保证计算机网络的安全运行,为用户提高优质的网络服务。

高性能计算机篇8

关键词:计算机网络;可靠性;设计原则;影响因素;优化技术

中图分类号:TP393.06

现代社会,我们正在大踏步的走向信息时代,人们的生活、工作对网络已经产生依赖,因此,要求网络带给我们的应该是安全、可靠的环境。计算机网络作为信息时代不可缺少的工具,其网络系统中所积累的数据信息、网络资源,在给人们提供极大便捷的同时也为非法入侵者提供了可乘之机,这都不利于系统内部的安全管理。计算机网络的后续发展应注重提高其安全性、可靠性,为用户提供一个开放、自由、可靠的数据交流、资源共享、信息传递的平台。

1 计算机网络可靠性的概念

计算机网络可靠性的具体内容是指:在一些特定的条件下或一定时间内,能够完成。例如,在一定的负载条件、维修方式、操作方式、湿度、辐射、温度等条件下,网络依然能够顺利的进行通信的能力。

2 计算机网络可靠性设计原则

在进行计算机网络可靠性优化研究的过程中,研究人员发现解决了很多相关问题,并从中积累了相关知识和经验,为了指导和保证日后的计算机网络可靠性优化研究工作能够顺利进行,少走弯路,特将经验总结成文,也成为现在研究人员进行计算机网络可靠性设计的原则。

2.1 遵循国际标准

以国际标准为主要标准,网络系统要具备高度的开放性,能够支持不同种类的设备或系统间相互联系,以保证计算机网络可以便利地进行空间升级、版本提高。计算机网络的拓扑结构要采用具有实用性、通用型的网络结构,在技术方面则应选择先进、成熟的网络系统。

2.2 互联能力强

为了保证多种通信协议间能够在计算机网络上运行,要确保计算机网络具备良好的相互连接,能够进行无缝隙的互联。此外,计算机网络还要具备较强的容错、冗余能力,满足用户需求,采用支持CMIP、SNMP、先进软件管理设备的网络,保证计算机网络运行时的信息、数据的安全。

2.3 可管理性强

计算机网络可靠性设计时,对于网络设备的选取,要优先选择技术与科技更高一筹的,以保证网络的先进性。且配备较充足的宽带资源,优化网络链路介质,提高性价比,加快计算机反应速度。

2.4 合理配置资源

计算机网络可靠性的设计,首要应该确保网络安全,将网络投资的风险降到最低,且要求充分合理的进行资源优化,将资源合理化管理。此外,网络布线、硬件设施、操作系统等也应该与网络系统高度匹配。

3 影响计算机网络可靠性的因素

影响计算机网络可靠性的因素有很多,主要可以归纳为以下几点:

首先,拓扑结构直接影响着计算机网络的可靠性,计算机中的各个组成部分,都是由拓扑结构连接组成。所以,拓扑结构各个参数的性能,以及拓扑结构对计算机网络中各参数,都是能够对计算机网络整体可靠性造成影响的因素。

其次,计算机网络的可靠性,也受到传输、交互的设备影响。计算机网络布局的合理与不合理也会影响可靠性,网络布局的不合理会导致计算机网络运行时,通信线路引起故障,且无法正常排除,避免通信线路故障,就要提高计算机网络的冗余能力,采用双线通信线路保证网络正常运行。计算机网络可靠性传输交互过程中,负责连接其他终端设备的主要是集线器,就算是某一终端设备发生故障,也不会影响网络的正常运行,不会影响其他设备正常运行,但是,如果故障出现在集线器上,计算机网络的全部运行都会受到影响。

然后,计算机网络管理技术也在计算机网络可靠性中发挥着重要作用。影响计算网络可靠性的因素很多,仅仅依靠各个设备的完备和判断是远远不够的。计算机网络中终端设备是网络运行的核心,这些设备要直接面向客户,计算机网络的可靠性要保证这些设备在连接时不受阻碍,能够顺畅的运行,提高完成工作的效率。而计算机网络管理技术就是对网络进行实时观测,保证设备在连接状态下,其他设备的正常运行,同时,也能够提供网络信息,有助于进行对网络数据、信息的统计和分析,同时也能够提高数据传输的完整性、高效性和可靠性。因此,通常也会将计算机网络管理技术在实践中的应用作为衡量整体网络结构可靠性的参考之一。

4 计算机网络可靠性的优化技术方法分析

计算机网络可靠性的模型,如想得到优化,可以利用分层技术、试凑方式进行,促进网咯的完善化进程。分层技术是将网络划分为四个层次,依次是:网络层、物理层、系统层、以及逻辑层,对这四个层次要进行可靠性测量指标、规范保护措施的设置,来保证计算机网络的可靠性。试凑方式是将所有可靠性的设计综合在一起,对于提高计算机网络可靠性有很大帮助,还能够保证为未来数据的扩充和升级作出充分的准备。

在提高计算机网络可靠性上,有两条途径可供选择,其一,是将计算机网络相关部件的可靠性提高,以达到全面提高整体计算机网络的可靠性;其二,提高计算机网络的冗余能力,通过附加相应冗余部件来实现,以此来提高网络的可靠性。如果在未调整之前,计算机网络就能够完成预期的功能,附加冗余部件就会增加备用链路的条数,这样计算机网络局域片段的可靠性便提高了,同时网络可靠性设计的成本增加了,计算机网络中每条链路都具备自己的可靠性和成本,因此,链路越多,虽成本越高,但是,相应的,计算机网络的可靠性也有所增加。

4.1 计算机网络的容错性设计策略

进行计算机网络容错的设计,必须严格依据其原则进行。一般的指导原则为:并行主干、双网络中心。具体设计还要根据具体情况进行原则调整。

双网络中心是指计算机网络、冗余计算机网络同时并行,提高可靠性的运行方法,意在将每个用户的终端、服务器同时连接到计算机网络中心、以及冗余计算机网络中心上。

进行设计计算机网络时,网络设备应该具备以下条件:具有模块化结构、热插热拨功能。此网络设备能够满足在其发生故障时,能够及时在不关断电源的前提下,进行更换故障模块,这样,便延长了计算机网络能够连续运行的时间,将计算机网络连续工作的能力也同时提高,计算机网络的容错能力得到相应提高,且使得组网方式也变得灵活方便。

进行计算机网络容错设计时还需注意,尽量使用多处理器、网络操作系统也要能够兼容容错功能,使网络以检查点为基本,具备故障恢复机能。

计算机网络设计时,边界网络与中心网络的连接,要采用多数据链路、多路由的方式,以防当其中一个莲路、路由发生故障的突发状况,这样网络还能够不影响局部网络,正常工作。

此外,应将新技术应用在网络服务器中,双机热备份、双机镜像、容错存储等技术,能够增强服务器的容错性、可靠性。

4.2 计算机网络的双网络冗余设计策略

在计算网络设计中,应用双网络冗余设计,是在单一的计算机网络基础上,额外增加另一个备用网络,这样的计算机网络具备两个网络系统,形成双网络结构,要用计算机的冗余增加计算机的容错能力。在计算机网络的双网络结构中,每个节点都通过双网络进行连接,当一个节点需要向另一个节点发送信息时,正常情况下,只需要经过一个网络可以发送,两个网络可以处在同时运行的状态下,信息可以通过两个网络同时传递,也可以运用主备方式应用两个网络,其中一个作为计算机网络的备份网络,当其中一个网络因为某些原因、或故障停止运行时,另一个计算机网络能够很快的替代错误故障网络,继续运行数据的传输,这样的双网络模式既保证了数据传输的可靠性,也保证了网络整体的可靠性。

4.3 采用多层网络结构体系

计算机网络应用的多层网络结构,能够充分利用网络的第三层业务,如分担负载、网络业务量分段、故障恢复等,也可以减少因配置不当、或设备故障等引起的网络问题。如果采用分层结构,就能够将网络的故障进行较好的隔离,减少故障发生的可能性。分层技术能够使所有常用的网络协议得到支持,改变计算机网络的移植方式,使移植更简单易行,它保留了在路由器、集线器之上的网络寻址方案,对之前的计算机网络,有较好的兼容性。

计算机网络的多层结构包括三层结构:

接入层:计算机网络的接入层,相对与用户,是一个起点的结合层,用户要由此接入计算机网络,即网络体验由此而生。接入层能够过滤访问控制列表提供的流量信息。接入层的主要功能是:为用户连接网络提供,最终计算机网络接口,在计算机网络模型中,为第二层提供服务,例如基于接口、Mac地址的Vlan成员资格、数据流过滤等,接入层还为计算机网络提供交换的宽带。在局域网中,接入层主要服务的设备,一般具有以下特点:低成本、高端口密度。

分布层:计算机网络的分布层,是接入层与核心层的连接层次,也是两者的分界点。分布层还作为辅助功能的一层,也能够有助于定义、区分计算机的核心层。该分层提供了边界定义,并在此处,对于潜在的、费力的、复杂的数据包进行预处理。分布层的功能,在局域网的前提下,进行最多的有以下几点:首先,部门级、工作组在计算机网络中的接入,其次有VLAN的聚合,最后,广播域网、多点广播域网、在计算机网络中的联网方式的确定。

核心层:核心层是计算接网络中最主要的层次,起到主干作用。它能够进行尽可能快的交换数据,次层次不涉及费力的数据包、以及减慢数据交换的处理。在划分计算机网络逻辑功能时,应该尽量避免,在核心层使用访问控制列表、数据包等类似的功能。核心层在计算机网络中,主要负责以下几点功能:交换区块间的连接由核心层提供;其他区块的访问由核心层提供,如服务区块等;快速的交换数据帧、数据包。

5 结束语

纵观科技的发展,计算机网络越来越完善,而人们所提出的要求也越来越高。大家想要通过网络了解到全世界,点击到未知的一切,这个荒诞的想法已不再遥远,尽管现在对于我们还不那么容易。但是,伴随计算机网络的发展,它的前景一定能够带给我们意想不到的梦幻天堂,凭借人类的智慧和创造,计算机网络将带我们进入另一个自由的、奇幻的、微妙的新世界。

参考文献:

[1]唐潍.浅谈提高计算机网络可靠性的途径[J].计算机光盘软件与应用,2011(07):17-19.

[2]刘专志,陈辉.关于计算机网络可靠性优化技术的探析[J].科学与财富,2011(03):04-08.

高性能计算机篇9

关键词:超级计算机;高性能计算机;FLOPS;超级计算机的进展

中图分类号:TP338.4

超级计算机是一个计算机集群系统,它通过各种互联技术将多个计算机系统连接在一起,利用所有被连接系统的综合计算能力来处理大型计算问题[1]。衡量高性能计算机的水准主要是看其计算速度,即每秒多少次浮点操作数,符号记做FLOPS(floating-point operations per second)。随着社会和科技的发展,超级计算机在世界上已经得到了飞速的发展,并且有了广泛的应用。现就世界及中国超级计算机的一些情况,综述如下。

1 世界超级计算机的进展

1.1 世界超级计算机的发展情况。从上个世纪60年代开始,计算机就开始应用于各种商业领域,为了区别这种“通用计算机”,人们将专门针对科学计算进行优化设计的计算机被称为“高性能计算机”,或者叫超级计算机。世界超级计算机生产商有Intel、IBM、NEC、Cary等,中国有联想、曙光、浪潮等。1964年诞生的CDC6600被公认为世界上第一台巨型计算机,其运算速度为1M-FLOPS。70年代初研制成功的STAR-100向量机,是世界上最早的向量机。人们把20世纪70年代出现的向量机看做是第一代高性能计算机。通过在计算机中加入向量流水部件,可以大大提高科学计算中向量运算的速度,其中比较著名的有CDC系列、CRAY系列、NEC的SX系列向量机,中国有代表性的向量机是银河一号及中科院计算所的757计算机[2]。在此之后到20世纪90年代,世界超级计算机进入了其发展的鼎盛时期,其代表机型如1976年Cary公司的Cary-1;1985年Cary-2;1990年SX-3等。自20世纪90年代至今,是超级计算机的飞速发展期,其代表机型如1988年BBN公司的TC200;1992年Intel公司的Paragon;1994年IBM公司的SP2;1996年SGI公司的Origin2000等等。

世界超级计算机的排名每年进行两次,目前最新Top10的排行榜如表1。

表1 2009年6月世界超级计算机Top10

名次 型号 生产商 计算速度

1 Roadrunner IBM 每秒1.105千万亿次

2 Jaguar –Cary XT5 Cary 每秒1.059千万亿次

3 Jugene-BlueGene/P Solution IBM 每秒1.002千万亿次

4 Pleiades-SGI Altix ICE8200EX SCI 每秒608.8万亿次

5 BuleGene/L IBM 每秒607.2万亿次

6 Kraken XT5 Cary 每秒596.3万亿次

7 Blue Gene/P Solution IBM 每秒579.3万亿次

8 Ranger-SunBlade x6420 Sun 每秒557.1万亿次

9 Dawn-Blue Gene/P Solution IBM 每秒501.3万亿次

10 JUROPA-Sun Constellation Dull SA 每秒308.3万亿次

1.2 世界超级计算机的应用。超级计算机是世界高新科技领域的战略制高点,可以广泛应用大规模科学与工程的计算,包括航空航天、装备研制、金融领域等。目前,全球90%以上的高性能计算机用作服务器,主要安装在商业、金融、通信、国防、政府等部门,用于商用计算、事务处理、数据库应用、网络服务等。这类计算机对保障金融安全、通信安全,推进尖端武器研发等具有重要作用。随着软硬件技术能力的提高,高性能计算机正日益走向普及,从通信、金融、军工、气象等大企业的高端应用逐步走向中小企事业单位的普及型应用。

1.3 世界超级计算机的评价。世界超级计算机的高端科技主要集中在发达国家,如美国、日本等。他们利用其雄厚的技术力量,以广泛应用到国防、军事、商业等各行各业,并极大的促进了社会的进步,给社会带来了巨大的经济效益和经济效益。

2 中国超级计算机的进展

2.1 中国超级计算机的发展情况。1959年9月,中国国家科学院计算技术所成功研制出我国第一台大型通用计算机,104计算机,当时它的计算速度是每秒1万次,在我国第一颗原子弹的理论射击和研制中发挥了重要作用。从上个世纪90年代开始,在国家“863计划”的支持下,我国的超级计算机得到了飞速的发展,并成功研制推出多种高性能的计算机,具体情况如表2,中国超级计算机的发展年谱。2008年,联想“深腾7000”和“曙光5000A”百万次级超级计算机研制成功并进入了世界超级计算机TOP500的排行榜[3]。而且曙光5000A在2008年成功跻身于世界超级计算机top10。

据2009年10月底最新消息显示,中国国防科学技术大学已研制成功我国首台千万亿次超级计算机系统——“天河一号”,它的系统峰值性能达到每秒1206万亿次。有关专家认为,“天河一号”的诞生,是我国高性能计算机技术发展的又一重大突破,实现了我国自主研制超级计算机从百万亿次到千万亿次的跨越,使我国成为世界上继美国之后第二个能够研制千万亿次超级计算机系统的国家,也是第一个能够研制千万亿次超级计算机的发展中国家,具有重要的历史意义。

到目前为止,中国是继美国、日本之后的第三大超级计算机的生产国。

表2 中国超级计算机的发展年谱

型号 面世时间 每秒运算速度

104计算机 1959年 1万次

银河—Ⅰ 1983年 1亿次

曙光一号 1992年 6.4亿次

银河—Ⅱ 1993年 10亿次

银河—Ⅲ 1997年 130亿次

神威—Ⅰ 1999年 3840亿次

深腾6800 2003年 5万亿次

曙光—4000A 2004年 11万亿次

神威3000A 2007年 18万亿次

深腾7000 2008年 106.5万亿次

曙光—5000A 2008年 230万亿次

天河一号 2009年10月 千万亿次

2.2 中国超级计算机的应用。超级计算机的广泛应用,可以给社会带来巨大的经济效益和社会效益,至今为止,我国的超级能计算机在研究与应用已取得了一些成功,它不仅广泛应用与军事国防、金融、政府、通信等领域,并也在商业、科技、生产等各种大中型企业单位得到了推广。目前已经规划的应用包括生物医药领域、科学数据库、汽车研制方面、船舶设计、石油开采领域、航天科技领域、气象预报、自然资源考察和远程教育等领域[4]。

例如东方石油公司目前勘探的石油占全世界石油市场的25%,他们依靠的就是用高性能计算机进行物探计算,计算机能力上去了,业务就发展起来了,这就是生产力,从这一点上来说高性能计算机是发展先进生产力很重要的组成部分。再如中科院青岛生物能源与过程研究所利用超级计算机来研究最新的生物能源,此系统主要用于基因组、转录组、蛋白质组、代谢物组等生物学信息的高通量获取、处理、存储、注释、模拟和分析;代谢工程中代谢通量和细胞活动的分析与模拟;酶工程中蛋白质结构及其与其他分子之相互作用的解析和模拟;复杂工程反应过程和反应器的设计与模拟等。另外,超级计算机能计算航空航天工业中的数字风洞,可以减少实验次数,缩短研制周期,节约研制费用;利用超级计算机做气象预报和气候模拟,对厄尔尼诺现象及灾害性天气进行预警,例如国庆60周年期间,国家气象局利用国产高性能计算机,对北京地区进行了集合预报、中尺度预报和短期天气预报,取得了良好的预报结果;此外,在生物医药、生物信息学、船舶设计、汽车设计和碰撞模拟以及三峡工程施工管理和质量控制等领域都有高性能计算机成功应用的实例。

总得说来,中国的超级计算机的应用还有待进一步的推广,以便给国家和社会带来更大的社会效益和经济效益。

2.3 中国超级计算机的评价。在超级计算机领域,我国与世界先进水平还有相当大的差距。这主要表现在:(1)迄今为止,进入世界500强排行榜的国产超级计算机总数只有区区10台,而且这些计算机主要是靠五年一期的国家科技计划支持研制的,没有形成持续均衡发展的态势;(2)国产高性能计算机应用面还不够广泛,目前主要应用在科学工程计算领域,金融等领域,而且超级计算机所需的高端服务器和大型机主要从国外进口,这不仅花费国家巨额资金,而且难以保证数据和信息的安全性;(3)国产高性能计算机产业规模和国内市场份额还很小,与我国的国际经济地位相比,显得有些不平衡;(4)我国高性能计算机的关键元器件,特别是中央处理器芯片目前仍依赖国外厂商[5]。

3 超级计算机的发展趋势预测

随着社会的进步与发展,超级计算机将会有更大突破。我国制定的一系列超级计算机发展战略,如加大了人才的培养力度等,相信我国超级计算机的发展会在机遇和挑战中获得更大的进步,力争赶上并超过发达国家。就超级计算机的未来发展趋势来看,在性能方面,超级计算机将会朝着低耗能、低成本的方向发展;在应用方面,超级计算机将会逐步渗透到中小企业领域,从而极大地促进经济的发展和社会的进步。

4 结语

超级计算机的研制是一项非常复杂的、系统性的工程,提高超级计算机的性能还有许多关键问题有待解决。比如,超级计算机的数据吞吐能力以及高效率工作的问题等等。尽管我国已经能够制造几百万亿次级的高性能计算机,但是超级计算机的整体水平与美国、日本和欧洲发达国家相比,仍有较大的差距[6]。因此进一步发展和提高我超级计算机的水平及应用任重而道远。

参考文献:

[1]李硕,唐胜男.高性能计算机体系结构综述[J].北京邮电大学网络与交换技术国家重点实验室.

[2]樊建平,陈明宇.高性能计算机研究的现状与展望[J].信息技快报,2003,1(5).

[3]曹来发,贾成科.我国巨型机的发展概述[J].内蒙古科技与经济,2005,1.

[4]刘柏,王文海,于智.高性能计算机发展现状与我国发展高性能计算机遇到的问题[J].广西轻工业,2006,6.

[5]胡永生.我国高性能计算机产业发展的挑战和机遇[J].科技日报,2008.

[6]钱德沛.我国高性能计算机的应用前景及发展中的问题[J].中国信息导报,2005,10.

高性能计算机篇10

关键词:中专卫校;计算机教学;实效性

随着现代信息技术的不断发展,社会日益呈现出信息化与科技化的变化趋势,对于人才的培养也更加趋向于创新教育与素质教育,其中计算机应用就是一门最为重要的基础性课程,在中职卫校中必须加强计算机的教学,尤其要注重提高其教学实效性,才能促进中职卫校教育的不断发展,使学生在未来的就业竞争中占据有利地位,为将来的择业就业奠定良好的基础。

一、提高中专卫校计算机教学实效性的意义中专卫校的医学教育本就对实践非常重视,而计算技术已经渗透到医学临床治疗的多个方面,比如B超与X线的摄影以及在日常护理中经常使用的输液报警器,等等。由于计算机技术在医学中的应用日益广泛,所以学生必须掌握一定的计算机操作技术,提高其计算机知识的应用性与实践性。现阶段很多医学专业机构的医学人员由于没有掌握足够的计算机应用技术,所以在医学信息化不断发展的今天,常常导致在其工作中出现失误,大大降低了其工作的质量。因此,加强中专卫校的计算机教育,提高计算机教学的实效性具有非常重要的现实意义。

二、提高中专卫校计算机教学实效性的措施1加大计算机教学的资金投入

在中专卫校中,资金投入是提高其教学质量与实效性的基础与关键,但是现阶段的中专卫校往往缺乏足够的资金投入,特别是计算机教学基础设施的投入不足,影响了计算机应用基础课程的有效教学,只有加大这方面的资金投入,才能解决好这一问题,学生能够在计算机教学过程中实现一人一机上课,提高其学习效果,比如教师通过多媒体技术向学生演示SPSS等距分组以及频数分布表的制作,学生可以在下面进行同步操作,显著提高学习质量,促进学生对相关知识的了解与掌握,切实提高学生的计算机操作水平。

2提高计算机教学的专业性

中专卫校计算机教学中需要结合计算机知识与医学知识,教师需要明确卫校学生需要掌握的专业知识,才能在其教学过程中渗透一定的医学知识,提高计算机教学的实效性与应用性。比如教师在讲解一些计算机知识时可以适当列举一些医学方面的例子,讲授表格如何创建的过程中,教师可以以电子病历为例,不仅让学生掌握表格创建的理论知识,还能促进学生对相关知识在医学中相应作用的理解,通过这种在计算机教学过程中渗透医学知识的教学方法,激发学生的学习热情,切实提高计算机课堂的教学效果。

3提高计算机教学的实践性

医学是一种理论性较强的知识体系,在计算机教学过程中,教师要通过加强计算机操作技能的实践,提高学生对医学理论知识的理解,明确计算机技术在医学理论知识掌握中的重要作用,同时还要加强学生在实践操作过程中的规范性与创新性,激发学生的实践与创新潜力。教师可以通过设置一些趣味性和实用性较强的计算机操作题目,提高学生的创新意识与实践自觉性,还可以通过组织学生参观现实医疗中的相关操作设备,明确计算机技术的实践操作在医学应用中的重要意义。

4提高计算机教学的自主性

计算机教学的实效性还要充分鼓励学生进行自主学习,在计算机教学的实际过程中,学生只有通过自主学习,才能提高自身的学术钻研能力,提高学生的计算机应用水平。所以,在课堂教学中,教师可以适当减少授课时间,组织学生进行一系列的研究性学习,充分发挥学生的主观性,在一些技术含量相对较低的课程比如Word的学习过程中,可以采用学生备课讲授的方法,鼓励学生进行自主创新,不断巩固自己的计算机操作基础,提高学生学习计算机知识的主动性与积极性,切实提高学生的实践操作能力。

综上所述,在中专卫校的计算机教学中,只有提高教学的实效性才能充分发挥计算机知识在医学中的作用,满足当今医学发展的实际需求。所以卫校应加大计算机教学的资金投入,教师应在其教学过程中提高计算机教学的专业性、实践性以及自主性,切实提高学生的计算机理论基础与实践操作水平,使其更能满足将来医学岗位的需要,为其将来的择业就业奠定坚实的基础。

参考文献: