⾼性能计算机系统硬件结构图,硬件资源
“天河”超级计算机⾸次提出 CPU+GPU 的异构融合并⾏计算体系结构,提出CPU 和 GPU 相结合的⾼性能计算与效率优化的理论和途径,探索⾯向科学⼯程计算的新型加速技术与⽅法,突破新型⾼效能计算体系结构关键技术,通过模块化的异构计算部件、操作系统/编译系统的异构协同⽀撑和优化、以及异构并⾏程序设计环境等,⾼效实现CPU+GPU的异构协同并⾏计算,使 CPU+GPU 的实⽤计算效率达到 70.1%;突破⾯向 GPU 的异构并⾏性能与功耗优化难题,使天河系统计算效率与能耗⽐居国际领先⽔平。
中⼼“天河”超级计算系统配置了3个管理结点、128个存储处理与服务结点组成的服务阵列、64个可视化结点构成的可视化阵列、4个四路登陆服务结点、4个⼋路服务结点以及26个I/O结点。
系统结构图
主要技术指标如下:
1)全系统峰值计算性能1372万亿次,其中,全系统CPU峰值计算性能317.3万亿次,GPU峰值计算性能1054.7万亿次;全系统内存容量106TB,共享磁盘总容量1.43PB。
2)全系统共包括4586个CPU,其中8路8核CPU 32个,2路6核和 8核CPU 4538个,4路6核CPU 16个,全系统共包括2048个GPU。
3)系统配置2048个⼑⽚结点组成计算阵列。结点采⽤2路6核Intel Xeon Westmere EP⾼性能处理器,主频2.93GHz,内存48GB,每个结点配置1个Nvidia M2050 GPU,单个计算结点CPU峰值性能140.64GFlops,GPU峰值性能515GFlops。
4)系统配置128个存储处理与服务结点组成服务阵列。结点采⽤2路6核Intel Xeon Westmere EP⾼性能处理器,主频2.93GHz,内存
48GB,单个计算结点峰值性能140.64GFlops。
5)系统配置64个可视化结点构成可视化阵列。结点采⽤2路6核Intel Xeon Westmere EP⾼性能处理器,
主频2.93GHz,内存48GB,单个计算结点峰值性能140.64GFlops;结点配置Nvidia M2050图形加速卡,峰值计算性能515GFlops。
6)系统配置4个⼋路服务结点,采⽤8路8核结构,配置8个Intel Xeon Nehalem EX⾼性能处理器,主频2.27GHz,内存256GB,单个计算结点峰值性能578.56GFlops。
7)计算阵列采⽤THNI定制⾼性能通信互连专⽹,双向通信带宽160Gb/s,提供⾼带宽低延迟通信。
8)系统⾼速互连⽹络采⽤⽆阻塞线速千/万兆以太⽹交换结构,核⼼交换机提供288个千兆端⼝和24个万兆端⼝,连接登录管理结点、数据处理与服务结点、可视化结点、⽹络存储设备等。
9)系统由26个I/O结点组成⼤规模科学计算存储,采⽤对象存储体系结构,采⽤超⾼速专⽤⽹络和计算系统互连,共享磁盘容量384TB;海量数据处理存储采⽤分布散列存储架构结合SAN和NAS存储结构,采⽤⾼性能互连⽹络与处理系统互连,共享磁盘容量为892.8TB;全系统磁盘存储总容量为1.28PB。
10)全系统功耗1.212MW。
计算机硬件组成11)操作系统采⽤银河麒麟Linux操作系统,符合国际标准和规范,与Linux⼆进制兼容,提供安全隔离、⽤户登录控制等安全功能。
12)编译系统⽀持C、C++、Fortran77/90/95;⽀持MPI 3.0,OpenMP 3.0,⽀持MPI/OpenMP嵌套并⾏。
13)提供⼤规模分布共享并⾏⽂件系统THGPFS和HDFS,⽀持T级⽂件数量和P级的数据存储,⽀持在线扩容,⽀持⽂件系统容错,为全系统提供统⼀⽂件系统视图。
14)资源管理系统功能强,提供作业运⾏状态的统计分析、作业调度、分区管理、调度策略定制、记账管理等功能;⽀持应⽤按需调度;提供全系统的⾃适应容错管理和能耗管理,稳定有效。
15)监控管理系统提供统⼀的系统管理、开关机、故障监控和诊断功能,对系统环境进⾏实时监测和安全监护,并为系统提供⽅便实⽤的调试、诊断、维护⼯具和⼿段。
16)系统⽀持多种容错和⾼可⽤技术,包括全系统监控诊断、部件热插拔、故障结点隔离、系统级检查点⽀持等。
17)系统提供实⽤的并⾏程序开发环境、Hadoop分布编程框架、数据库服务、可视化服务,以及多种应⽤服务软件,⽀持⼴泛的第三⽅应⽤软件。
18)系统配置4个登录服务结点,采⽤4路6核Intel Xeon Nehalem EX CPU,主频2.0GHz,内存64GB,300GB SAS硬盘×2, ⾼速互连接⼝,2个千兆以太⽹。
“天河”超级计算机外观图
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论