首站-论文投稿智能助手
典型文献
开放环境多分布特性的局部敏感哈希检索方法
文献摘要:
基于局部敏感哈希的检索方法能够较好地解决高维大规模数据的近似近邻检索问题.但在开放环境下针对多种分布特性时,迄今尚未有令人满意的解决方案.利用Laplacian算子对数据分布剧烈变化敏感的特性,提出一种具有全局性、适用于开放环境下多种分布特性的基于Laplacian算子的局部敏感哈希搜索方法(LPLSH).该方法把Laplacian算子应用于数据投影的概率密度分布,找到数据投影分布的剧烈变化位置作为超平面的偏移量.从理论上证明了精简维度的哈希函数能够保持局部敏感性及低投影密度区间分割的有效性,分析了利用Laplacian算子计算的二阶导数对超平面偏移量设置的指导意义.与其他8种方法对比,LPLSH算法的F1值是其他方法最优值的0.8倍?5倍,耗费时间也大幅减少.通过对具有多种分布特性数据集上的实验验证,结果表明:LPLSH方法能够同时兼顾效率、精度和召回率,可满足开放环境下多分布特性的大规模高维检索的鲁棒性需求.
文献关键词:
开放环境;近似近邻检索;数据多分布特性;局部敏感哈希;数据检索
作者姓名:
张仕;赖会霞;肖如良;潘淼鑫;张路路;陈伟林
作者机构:
福建师范大学 计算机与网络空间安全学院, 福建 福州 350117;数字福建环境监测物联网实验室(福建师范大学), 福建 福州 350117;福建省网络安全与密码技术重点实验室(福建师范大学), 福建 福州 350117
文献出处:
引用格式:
[1]张仕;赖会霞;肖如良;潘淼鑫;张路路;陈伟林-.开放环境多分布特性的局部敏感哈希检索方法)[J].软件学报,2022(04):1200-1217
A类:
近似近邻检索,LPLSH,数据多分布特性
B类:
开放环境,局部敏感哈希,哈希检索,检索方法,高维,大规模数据,令人满意,Laplacian,数据分布,全局性,搜索方法,概率密度分布,超平面,偏移量,上证,精简,哈希函数,二阶导数,方法对比,其他方法,最优值,耗费,费时间,召回率,维检,性需求,数据检索
AB值:
0.232938
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。