高性能计算系统性能评价工具集

当前,高性能计算正在从“大计算”的HPC加速迈向“大计算”+“大数据”的HPDA(高性能数据分析),随着数据价值的提升和新兴数字产业的兴起。综合性能评测方法在设计高效工作的高性能计算集群系统中起着重要作用, 需要平衡处理器、网络和存储等组件的选型。

因此,《高性能计算系统性能评价白皮书》旨在为高性能计算集群建立一个综合性能的评价标准,适用于高性能计算服务器厂商和高性能计算业务的提供者。对于厂商而言,观察分数可以了解产品在不同维度的性能表现;对于业务提供者而言, 这套评测标准能够为集群进行定性与分类,提供建设和扩容的参考建议,帮助进行更科学的管理。

根据白皮书提出的性能评价标准,我们整合测评过程中需要用到的测评软件及脚本,推出“超算测评工具集”。简化了高性能计算系统性能测试过程中的步骤,并直接提供结果报告和分数,使测试更加简单。

工具集特性

  • 有据可依:测试工具集基于《高性能计算系统性能评价白皮书》提出的测评标准,从5大维度、6个方向为超算测评提供工具支持,并选取有代表性的指标设计综合评价体系。
  • 运行简便:测试工具集体量小,能够轻松部署。适配多种Linux操作系统,支持OpenMPI并行模式,可服务不同规模的集群。
  • 结果清晰:测试完成后生成简明清晰的结果报告,易于通过报告掌握超算性能的当前状态,并根据分数有直观了解。
  • 运行依赖

    工具运行需要的依赖如下:

    • gcc 11.2.0
    • OpenMPI 4.1.1

    工具集涉及程序

    测评指标 程序名称 程序语言
    科学计算性能 HPL C
    HPCG C
    AI计算性能 MLPerf Python
    存储性能 IOR C
    warp go
    TestDFSIO C
    网络性能 OSU Micro Benchmarks C
    系统能效 无补充程序 无补充程序
    平衡性 STREAM C

    合作单位(排名不分先后)