首站-论文投稿智能助手
典型文献
基于键值存储的分布式时序相似性搜索方法
文献摘要:
时序相似性搜索是时序数据分析最基本的操作之一,具有广泛的应用场景.针对现有分布式算法无法应对维度增长、扫描范围过大和相似性计算耗时的问题,提出一种面向键值存储的分布式时序相似性搜索方法KV-Search.首先对时序数据分块,并设计其键值存入键值数据库,解决了时序数据维度高且不断增长的问题;其次,基于切比雪夫距离计算其下界,并利用键值范围扫描提前过滤无效数据,减少了数据传输;最后,利用基于分块的时序表示计算距离下界,避免了更高维度真实数据的计算,加快了查询效率.使用HBase实现了KV-Search,并利用真实的大规模数据集做了大量实验.实验结果表明,KV-Search算法在效率和扩展性方面均优于基准实验.
文献关键词:
时间序列;相似性搜索;键值存储;剪枝过滤;分布式查询
作者姓名:
俞自生;李瑞远;郭阳;蒋忠元;鲍捷;郑宇
作者机构:
西安电子科技大学网络与信息安全学院,陕西西安710126;北京京东智能城市大数据研究院,北京100176;重庆大学计算机学院,重庆400044;北京航空航天大学计算机学院,北京100191
文献出处:
引用格式:
[1]俞自生;李瑞远;郭阳;蒋忠元;鲍捷;郑宇-.基于键值存储的分布式时序相似性搜索方法)[J].软件学报,2022(03):950-967
A类:
剪枝过滤,分布式查询
B类:
键值存储,时序相似性,相似性搜索,搜索方法,时序数据分析,分布式算法,度增长,相似性计算,KV,Search,数据分块,存入,数据维度,切比雪夫距离,距离计算,下界,数据传输,高维度,真实数据,查询效率,HBase,大规模数据集,扩展性,准实验
AB值:
0.301968
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。