典型文献
一种适用于分布式存储集群的纠删码数据更新方法
文献摘要:
目前分布式存储集群广泛采用纠删码来保证数据可靠性,但是数据更新密集时存储集群的磁盘I/O开销会成为性能瓶颈.在常用的纠删码数据更新方法中,磁盘I/O开销主要包括:1)更新数据块时对数据节点的读后写操作;2)更新校验块时读写 日志的磁盘寻道开销.针对这些问题,提出PARD(parity logging with reserved space and data delta)数据更新方法,其主要思想是首先利用纠删码线性运算的特性来减少读后写操作;然后根据磁盘特性来降低磁盘寻道开销.PARD包含3个设计要点:1)采用即时的数据块更新和基于日志的校验块更新;2)利用纠删码线性运算的特性,构建基于数据增量的日志,极大限度地消除对数据节点的读后写操作;3)根据磁盘特性,在数据文件末尾为日志预留空间,减少读写日志的磁盘寻道开销.实验结果表明,当块大小为4 MB时,PARD的更新吞吐率相较于PLR(parity logging with reserved space),PARIX(speculative partial write),FO(full overwrite),分别 至少提升了30.4%,47.0%,82.0%.
文献关键词:
纠删码;存储集群;数据更新;增量;预留空间
中图分类号:
作者姓名:
章紫琳;刘铎;谭玉娟;吴宇;罗龙攀;王纬略;乔磊
作者机构:
重庆大学计算机学院 重庆 400044;北京控制工程研究所 北京 100080
文献出处:
引用格式:
[1]章紫琳;刘铎;谭玉娟;吴宇;罗龙攀;王纬略;乔磊-.一种适用于分布式存储集群的纠删码数据更新方法)[J].计算机研究与发展,2022(11):2451-2466
A类:
PARD,PARIX,overwrite
B类:
分布式存储,存储集群,纠删码,码数,数据更新,更新方法,保证数据,数据可靠性,新密,磁盘,开销,新数据,数据块,数据节点,读后,后写,校验,读写,日志,寻道,parity,logging,reserved,space,data,delta,来降,设计要点,数据文件,末尾,预留空间,MB,吞吐率,PLR,speculative,partial,FO,full,少提
AB值:
0.317198
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。