高性能计算( 四 )


高性能计算

文章插图
曙光CAE高性能计算平台简而言之 , 讨论的就是Linux高性能计算集群 。一个拥有20000台伺服器的信息中心要进行分子动力学模拟无疑是毫无问题的 , 就好比一个小型工程公司在它的机房里运行计算流体动力学(CFD)模拟 。解决工作负载的唯一限制来自于技术层面 。接下来我们要讨论的问题是什幺能直接加以套用 。量度(Metrics)性能(Performance) , 每瓦特性能(Performance/Watt) , 每平方英尺性能(Performance/Squarefoot)和性能价格比(Performance/dollar)等 , 对于提及的20000台伺服器的动力分子簇来说 , 原因是显而易见的 。运行这样的系统经常被伺服器的能量消耗(瓦特)和体积(平方英尺)所局限 。这两个要素都被计入总体拥有成本(TCO)之列 。在总体拥有成本(TCO)方面取得更大的经济效益是大家非常关注的 。议题的範围限定在性能方面来帮助大家理解性能能耗 , 性能密度和总体拥有成本(TCO)在实践中的重要性 。性能的定义 在这里把性能定义为一种计算率 。例如每天完成的工作负载 , 每秒钟浮点运算的速度(FLOPs)等等 。接下来要思考的是既定工作量的完成时间 。这两者是直接关联的 , 速度=1/(时间/工作量) 。因此性能是根据运行的工作量来进行测算的 , 通过计算其完成时间来转化成所需要的速度 。定量与定性从定性的层面上来说这个问题很容易回答 , 就是更快的处理器 , 更多容量的记忆体 , 表现更佳的网路和磁碟输入/输出子系统 。但当要在决定是否购买Linu集群时这样的回答就不够準确了 。对Linux高性能计算集群的性能进行量化分析 。为此介绍部分量化模型和方法技巧 , 它们能非常精确的对大家的业务决策进行指导 , 同时又非常简单实用 。举例来说 , 这些业务决策涉及的方面包括:购买---系统元件选购指南来获取最佳性能或者最经济的性能配置---鉴别系统及套用软体中的瓶颈
高性能计算

文章插图
Linux高性能计算集群模型计画---突出性能的关联性和局限性来制定中期商业计画Linux高性能计算集群模型包括四类主要的硬体组成部分 。(1)执行技术工作负载的计算节点或者伺服器;(2)一个用于集群管理 , 工作控制等方面的主节点;(3)互相连线的电缆和高度普及的千兆乙太网(GBE);(4)一些全局存储系统 , 像由主节点输出的NFS档案一样简单易用 。高性能计算机的衡量标準主要以计算速度(尤其是浮点运算速度)作为标準 。高性能计算机是信息领域的前沿高技术 , 在保障国家安全、推动国防科技进步、促进尖端武器发展方面具有直接推动作用 , 是衡量一个国家综合实力的重要标誌之一 。随着信息化社会的飞速发展 , 人类对信息处理能力的要求越来越高 , 不仅石油勘探、气象预报、航天国防、科学研究等需求高性能计算机 , 而金融、政府信息化、教育、企业、网路游戏等更广泛的领域对高性能计算的需求迅猛增长 。一个简单量化的运用模型这样一个量化的运用模型非常直观 。在一个集群上对既定的工作完成的时间大约等同于在独立的子系统上花费的时间:e1、时间(Time)=节点时间(Tnode)+电缆时间(Tfabric)+存储时间(Tstorage)Time = Tnode + Tfabric + Tstorag这里所说的时间(Time)指的是执行工作量的完成时间 , 节点时间(Tnode)是指在计算节点上花费的完成时间 , 电缆时间(Tfabric)是指在网际网路上各个节点进行互联的完成时间 , 而存储时间(Tstorage)则是指访问区域网路或全球存储系统的完成时间 。计算节点的完成时间大约等同于在独立的子系统上花费的时间:2、节点时间(Tnode)=核心时间(Tcore) +记忆体时间(Tmemory)这里所说的核心时间(Tcore)指的是在微处理器计算节点上的完成时间 。而记忆体时间(Tmemory)就是指访问主存储器的完成时间 。这个模型对于单个的CPU计算节点来说是非常实用的 , 而且能很容易的扩展到通用双插槽(SMP对称多处理)计算节点 。为了使第二套模型更加实用 , 子系统的完成时间也必须和计算节点的物理配置参数相关联 , 例如处理器的速度 , 记忆体的速度等等 。计算节点 图示中的计算节点原型来认识相关的配置参数 。图示上端的是2个处理器插槽 , 通过前端汇流排(FSB-front side bus)与记忆体控制中心(MCH)相连 。这个记忆体控制中心(MCH)有四个存储信道 。同时还有一个Infiniband HCA通过信道点对点串列(PCIe)连线在一起 。像千兆乙太网和串列接口(SATA)硬碟之类的低速的输入输出系统都是通过晶片组中的南桥通道(South Bridge)相连线的 。在图示中 , 大家可以看到每个主要部件旁边都用红色标注了一个性能相关参数 。这些参数详细的说明了影响性能(并非全部)的硬体的特性 。它们通常也和硬体的成本直接相关 。举例来说 , 处理器时钟频率(fcore)在多数工作负荷状态下对性能影响巨大 。根据供求交叉半导体产额曲线原理 , 处理器速度越快 , 相应成本也会更高 。