来源:大众网
近日,由天翼云弹性存储创新实验室撰写的《ACH-Code: An Efficient Erasure Code to Reduce Average Repair Cost in Cloud Storage Systems of Multiple Availability Zones》论文被The 20th Annual IFIP International Conference on Network and Parallel Computing (NPC 2024)收录。
NPC是云计算领域较高水平的国际学术会议,也是中国计算机学会CCF推荐的国际会议之一。NPC 2024旨在为研究人员、学者和业界专业人士提供一个以网络与并行计算为主题的高水平国际学术交流平台,促进相关领域的研究和发展。此次弹性存储创新实验室所著论文被收录,代表着天翼云技术创新能力再获业界权威机构认可。
纠删码是多可用区云存储系统中常用的容错方式,能够大幅提升存储空间利用率,同时保证存储的高可靠性。然而,受地理位置和网络架构影响,可用区之间的网络延迟不可避免。传统纠删码在多可用区存储系统中应用时,需要传输分布在不同可用区的数据,进行多轮远程网络通信,继而导致故障块修复效率较低。
针对上述痛点,该论文提出了一种新型纠删码——ACH-Code。在多可用区存储系统中,ACH-Code能够将数据块和全局校验块按照可用区分组,并生成局部校验块。这种独特的设计使得任意一个故障块在修复时,仅需其所在可用区内的其他数据块和校验块参与,不再需要跨可用区数据传输,从而提升了故障块修复效率。
ACH-Code的编码方式如图1所示。数据按照条带大小进行切割后,利用改造的Hitchhiker码编码方式进行全局校验块的构建,并将数据块和全局校验块均匀的分布到多个可用区当中。最后针对每个分组使用Clay码编码,构建每个可用区的局部校验块。
图1 ACH-Code编码方法
当出现故障块时,ACH-Code便通过解码的方式,对故障块进行修复。如果同一可用区中,故障块数量低于局部校验块的数量,则Clay码修复,否则通过Hitchhiker码修复。
该论文通过对ACH-Code进行工程实现和实验分析,结果表明ACH-Code的平均修复时间更短,修复效率更高。
科技创新引领产业发展,天翼云将紧跟国家重大战略方向,致力于数字中国建设,坚持核心技术自主攻关,助推数字经济发展,为数字中国建设贡献国云力量。