来源:光明网

日前,开放计算标准工作委员会(OCTC)与OCP中国社区共同主办“面向应用的服务器算效标准与评估”开放计算技术沙龙。会上,为推动算力产业的快速发展,OCTC正式公布面向多样化应用场景的《服务器算力算效评价规范》(以下简称“规范”)。该规范由中国电子工业标准化技术协会牵头,业界芯片厂商、系统厂商及数据中心用户等联合参与编制,旨在面向大数据、虚拟化、数据库、人工智能等不同计算场景评估系统性能,帮助客户从应用出发找到适合的算力支撑平台。

与传统评测更看重CPU基础性能不同,《服务器算力算效评价规范》是一款面向实际应用场景的评价基准,以服务器整机为评测对象,构建20多个基础性能和应用性能评测指标,其中应用性能涵盖数据库、大数据、虚拟化、AI等多种场景。目前,互联网、通信、能源和交通行业用户正针对评价规范率先开展测试工作。

面向实际应用评估系统性能 《服务器算力算效评价规范》立项

应对多样化算力缺口,亟需服务器算力算效评价新法

随着大数据、人工智能、云计算等前沿技术的广泛应用,服务器应用场景日益丰富,从大数据分析到深度学习模型训练,任务类型日趋多样化。多样化不仅体现在计算量和数据规模的增长,还体现在计算范式变化,如实时分析、图计算等,而传统以处理器主频、浮点运算能力为评价指标的性能评测基准,已远远不能全面、准确地反映服务器的算力算效。

举例来看,传统评测基准主要评估处理器在特定负载下的整数和浮点运算能力,通常仅关注CPU和RAM之间的交互,忽略了新兴场景中IO、大数据、AI、虚拟化、数据库等特定计算任务对算力的差异化需求。随着技术的进步,市场涌现了众多针对不同应用场景优化的服务器硬件和软件解决方案,如专为深度学习设计的加速卡、用于大数据分析优化的DPU等,传统基准已不再适用这些创新产品的评测。

与此同时,降低能源成本和数据中心碳排放的压力不断增加,服务器能效提升成为必然趋势。虽然业界对于国家及地区宏观能效调控以及规模化算力中心的能效标准均有定义,但对于整机及部件使用环节的碳排放评测缺乏统一标准,亟需针对算力能效的科学评价规范,实现最小颗粒度的量化评估,引导服务器厂商提高算力能效相关设计,满足绿色低碳、降低PUE等要求。

《服务器算力算效评价规范》立项,行业用户已启动测试

为构建面向多样化应用的科学算力算效评价基准,《服务器算力算效评价规范》在中国电子工业标准化技术协会立项。该规范通过衡量服务器系统在多样化场景和业务中的算力性能,旨在展示服务器产品在各应用领域中的算力特性,以满足多样化计算评估、能效优化、ROI评估和市场推广等需求。

该规范遵循权威基准测试的相关性、可重复性、公平性、可验证性、可用性五大原则,推出了一套全新的面向应用的算力算效标准,涵盖从常规的CPU和GPU,到专用的AI和大数据处理硬件等多种计算设备,同时测试框架支持风冷和液冷服务器环境,以帮助用户有效的监控和评估计算效率,以便高效管理和优化计算资源。

该规范共设计20多个评测指标,涵盖整数型、浮点运算、代码解析、IO等基础性能,以及数据库、大数据库、虚拟化、AI等应用性能。通过运行典型应用场景,能够全面评估服务器的基础性能、工作负载效率和应用负载效率。如利用Hadoop场景评估服务器系统面向大数据分布式计算、海量数据处理能力;利用ResNet、BERT评估服务器系统在深度学习和语言模型应用中的性能;利用KVM+MySQL评估服务器系统在虚拟化和云主机场景中的能力等。

该规范的制定,能够为服务器制造商、测试机构、数据中心运营商和云服务提供商等提供科学、系统的评估依据,确保服务器在不同应用场景下的高效运行和能耗优化,满足高效、可衡量和可优化的计算力解决方案的评估需求,推动整个计算行业的发展。目前,《服务器算力算效评价规范》的评测工具和标准细则正在制定中。(战 钊)