HPC(High Performance Computing)即高性能计算,是计算机科学的一个分支,主要解决大规模科学问题的计算和海量数据的处理。使用超算系统的主要原因是为了提高运算速度,使其达到每秒万亿次级的计算速度,HPC系统对处理器、运算方式、系统I/O、存储、网络等方面的要求都十分高,每一个环节都将直接影响到系统的运算速度。
用户目前主要存在两种获取HPC算力的方式,一种是自建超算集群,另一种是购买超算服务。
- 首先高性能计算集群建设属于重资产,建设周期长、成本高,无法满足用户灵活的业务形态要求,必然造成资源的浪费或算力不足。
- 高性能计算维护工作繁重、压力大,维护需要用户投入大量人力和物力,会导致用户无法全力聚焦自身的核心业务上。
- 用户还需要自建机房,涉及到的水费、电费、系统维护费等会产生非常高的运营成本。
- 硬件设备更新迭代速度快,而用户的计算量也快速膨胀,新需求、新技术层出不穷,设备逐渐老化,会使用户无法满足新的业务对算力的需求。
随着云计算的到来,使数据和计算可以在云上存储和获取,数据不下云,减少用户重资产以及维护工作,可使客户聚焦在自身的业务发展上。
有孚原力超算平台,是一种性能高、稳定强、易操作、大容量的公共高性能计算云服务,用户通过云平台即可获得所需算力,而无需自己构建高性能计算集群。有孚原力超算平台集成了用户登录、文件传输、程序编译、算力分配、作业执行、资源监控和计量计费等,将高性能计算物理集群封装为可进行统管理和调度的算力应用平台,提供低门槛、弹性、安全、便捷的公共高性能算力服务,以超优的服务让使用者更专注于应用运算。
以云服务的形式提供高性能运算,充分利用云服务的优势,实现高性能资源按需租用,帮助用户降低TCO,缩短产品上市周期,提升用户自身产品竞争力。用户可即租即用,根据工作负载动态配置资源,实现算力自由。
超强的计算能力,目前华南超算中心可提供2.3Tflops每节点运算能力,整体可提供约1Pflops运算能力;作业调度系统每秒可同时提交调度超过1000个任务,减少业务调度等待时间,快速处理客户的请求;
并行文件系统采用轮询方式跨对象存储将数据条带化以提高并行文件的IO处理能力;
并行文件系统采用分级存储方式,本地缓存方式可较大提升IO访问速度,客户端可以直接访问缓存层中的数据,避免了从客户端到服务器冗长的数据IO路径,降低应用的IO开销,减少网络延迟和锁冲突,减轻了并行文件系统负载的压力;
并行文件系统单个对象存储节点的处理性能可达15GB/s,元数据服务器支持200000/s 元数据统计操作,50000/s 创建操作,可支撑大规模海量数据访问的高度并发;
并行文件系统的控制流与数据流分离模式,提高了系统IO处理性能;
采用RDMA网络,降低了网络延迟,减少了计算资源的CPU使用,提升了网络传输效率。
作业调度系统可对上万台计算节点进行集中调度,适合于超大的算力平台使用;作业调度系统拥有超过100种插件,方便系统扩展架构和功能完善;
并行文件系统存储节点可扩展至1000个,其IO处理性能、存储容量线性增加;
并行文件系统可以跨多个对象进行文件分割,每个对象可使用动态文件系统多达256PB。
作业调度系统采用Munge安全认证机制,保证各用户间的作业进程的安全隔离;并行文件系统支持数据采用镜像方式存储,保证数据的安全可靠,可同时容忍磁盘和节点失效;
作业调度系统控制节点和计算节点容错率高,保证用户作业的稳定运行。
作业调度系统支持灵活的资源、作业调度策略,作业可按需获取各种资源;作业调度系统可选择交互式、批处理、实时分配和WEB页面实现对作业进行提交、跟踪、管理等操作。
随着信息化社会的飞速发展,人类对信息处理能力的要求越来越高。工欲善其事必先利其器,有孚网络作为国内领先的新型云计算数据中心服务商,重磅推出的有孚原力超算,将高性能计算物理集群封装为可进行统一管理和调度的算力应用平台,在石油勘探、气象预报、航天国防、科学研究、金融、政府信息化、教育、企业、网络游戏等更广泛的领域,为不同用户提供定制化的高性能计算服务,为企业数字化转型升级注入强劲新动力!