典型文献
流数据实时接收方案的研究
文献摘要:
针对现代数据仓库系统中常见的需接收大量流数据,且其与磁盘上已有的数据做连接后再入库的场景进行了探讨.通过合理设置磁盘分页和应用缓存模块,分散磁盘I/O压力,在已有研究的基础上提出了一种具有更高效率的数据接收方案,并引入一致性哈希函数将其扩展到分布式环境,提出一种应用于分布式环境的D-CACHEJOIN算法.通过理论计算算法的成本模型,并使用服从Zipfian分布的数据进行模拟实验.实验结果表明,在接近现实的实际应用场景下,所提算法拥有比现有算法更高的效率,同时能够快速方便地扩展到分布式环境.
文献关键词:
流数据;缓存;分布式系统;一致性哈希函数
中图分类号:
作者姓名:
张笑燕;刘志浩;杜晓峰;陆天波
作者机构:
北京邮电大学计算机学院(国家示范性软件学院),北京 100876
文献出处:
引用格式:
[1]张笑燕;刘志浩;杜晓峰;陆天波-.流数据实时接收方案的研究)[J].通信学报,2022(04):154-163
A类:
一致性哈希函数,CACHEJOIN,Zipfian
B类:
流数据,收方,数据仓库,仓库系统,磁盘,盘上,再入,入库,合理设置,分页,缓存,数据接收,分布式环境,计算算法,成本模型,服从,模拟实验,分布式系统
AB值:
0.30454
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。