来源:光明网

随着AI技术从机器学习演进至深度学习,并进一步迈向生成式AI的新阶段,算法、算力及数据需求呈现爆炸式增长态势。大模型爆发初期,众多企业布局,要求存储提供高带宽、高IOPS和低时延,以确保模型能够快速有效地进行训练。而在模型的实际部署与应用过程中,又需要实现数据的跨域、跨介质灵活调度,以及高质量数据集的高效管理,这对存储系统的灵活性、安全性及数据的可持续访问能力构成了新的挑战。

在近期举办的中国数据与存储峰会AI+存储协同发展论坛上,浪潮信息分布式存储产品总监张业兴发表了题为“数聚存储,智慧未来”的演讲。演讲中,张业兴回顾了过去一年人工智能领域的迅猛发展态势,并阐述浪潮信息在这一背景下如何精心布局新产品、新技术和新方案。

人工智能时代:存储的转型与重塑

人工智能已被提升至国家战略的高度,成为驱动新质生产力发展的关键力量。张业兴表示,数据作为一种新型生产要素,不仅是劳动工具,还能创造经济价值。随着数据的迅猛增长和摩尔定律的持续推动,人工智能正步入一个爆发式增长的阶段,特别是在GPU市场规模及智能算力领域,展现出了惊人的增长潜力。据预测,至2028年,全球GPU市场规模有望达到2461.5亿美元,而中国市场的规模也将攀升至459亿美元,年复合增长率高达32.8%。这一趋势清晰地表明,人工智能正引领着第四次工业革命,对经济社会产生着广泛而深远的影响。

在此背景下,存储系统的角色已悄然转变,它不再是单纯的数据存储容器,而是成为推动人工智能发展的核心组件。随着大模型技术的蓬勃发展,存储系统正面临着前所未有的挑战。在大模型市场的初期布局中,已有超过400家厂商争相涌入,模型训练的“速度”成为竞争的关键。为了提高GPU的利用效率,存储系统必须能够提供TB级的高带宽和百万级的高IOPS,以确保模型训练的高效运行。

此外,随着模型在各行业的落地,数据的跨域和跨介质调动变得至关重要,存储系统需要实现全局命名空间的管理,以支持大规模数据的高效汇集和利用。同时,在大模型的行业化落地过程中,为了提升通用模型的专业化能力,高质量且可重复利用的数据集成为了不可或缺的资源。数据的安全存储与可持续性访问能力成为存储系统必须满足的重要要求。

针对上述挑战,浪潮信息推出了分布式融合存储平台AS13000G7,在性能优化、融合互通、韧性保障等多个维度进行了技术创新。

在上海某高校的应用案例中,由于该校拥有多个与AI相关的学科,数据导入呈现出多元多态的特点,业务需求也涵盖了数据的汇集、处理、训练和推理等多个环节。浪潮信息为其提供32节点GPU服务器作为计算支持,并配置20个节点的AS13000G7 24盘位全闪节点作为存储资源池,实现对象文件融合存储,降低总体拥有成本(TCO)达30%,大带宽高IOPS的特性支持了模型毫秒级读写,进一步缩短训练等待时间40%。

从市场表现来看,浪潮信息在存储领域取得了显著的成就。2024年上半年,浪潮信息存储装机容量位列全球前三,企业级存储销售额在中国市场排名第二,全闪存储销售额同样在中国市场排名第二。

展望未来,浪潮信息将继续凭借其先进的技术和解决方案,在全球和国内存储市场中保持重要地位,并持续推动数据存储行业的发展。同时,浪潮信息也将致力于助力各行业在人工智能时代实现数字化转型和智能化升级,有望在技术创新和市场拓展方面取得更大的突破。(科文)