7 政策保障

7.1 高校体制机制保障

高校建设超算,如果只是买机器、管设备是远远不够的。体制机制这种“软性”层面的东西往往是高校算力服务发展的重要保障。 体制机制问题体现在很多方面。

例如,学校建设了校级算力平台之后,是否还应该允许院系建自己的平台?实际上,院系分散建设有很多局限性,其计算资源难以共享,利用率低;运维人员往往没有岗位编制,水平也参差不齐。在学校已经建设了校级算力平台的情况下,往往会造成很多资源浪费。

在这方面,交大于2018年出台政策,不允许院系自行购买信息系统程序服务器。如果院系想购买相关设备,需要双一流建设重点办公室、资产处、网络信息中心等部门共同管理和把关,由此大大提升了超算设备的使用效率。

再如,当老师需要计算服务时,应该如何申请,如何缴费,如何使用,如何开具证明?高校用户使用计算服务有着很复杂的流程,不是单个部门院系能够完成的,往往需要学校层面的协调。这些都体现了在高校超算建设中,体制机制的设计非常重要。

7.2 高校算力服务模式

高校算力服务的模式或类型可以从不同角度来看。

从校级算力平台所属单位的角度来看,一般有三种模式:一种是挂靠在院系/实验室等;一种是建有独立的高性能计算中心;还有一种是挂靠在网络中心/信息中心。

第一种模式的优点很明显,其所属单位为院系,院系的老师和学生可以直接参与其中,有足够的专业性支撑。但与此同时,这种模式的缺点也很明显,首先在服务上,要考虑除了为本院系服务,如何能让超算平台更好地为其他院系服务?此外在经费结算上,虽然平台是校级的,但在费用上如何由院系更好地管理?

第二种模式,校级算力平台所属的单位是独立的,在服务和结算方面会避免不少麻烦。但这种模式也有不少缺点。独立的单位需要配备专门的行政、财务、技术人员;与此同时,其员工的工作量可能是不饱和的,在学科的专业性方面也会受限。

第三种模式则介于两者之间,把校级算力平台放在网络中心。与第一种院系模式相比,可以更加专注于服务,对各院系而言更中立更公正。在对员工业务考核时,也以算力服务的质量为准。与第二种独立模式相比,网络中心已经有行政、财务等人员配置,可以对超算平台进行更好的统筹;在技术人员方面,超算平台需要懂机房、懂网络、懂安全的人才,而这些与网络中心的人才需求也是相通的。将算力平台放在网络中心,能在人员管理方面达到最优。

当然,每个高校面对的具体问题和环境都各不相同,在选择适合自己的建设模式时也会有不同的考量。以交大的经验来看,在对比权衡之下,我认为第三种将校级算力平台放在网络中心的模式是最优解。

从自建/合作的角度来看,大部分高校会选择自建算力平台。高校自建算力平台不仅包括将超算建设在学校内,也可能因为节能、环保和空间的原因将超算建设在外地;而校企合作多采取租用公有云的方式。学校在选择合适的模式时,不仅会考虑技术因素,更有很多非技术方面的考量,如对固定资产、数据安全等方面的考虑。