首站-论文投稿智能助手
典型文献
参数自适应下基于近邻图的近似最近邻搜索
文献摘要:
现有基于近邻图的近似最近邻搜索(ANNS)算法通常将数据库中被检索向量组织成近邻图结构,根据用户设定参数搜索查询向量的近似最近邻.为提升基于近邻图的ANNS算法在给定召回率下的搜索效率,提出一种参数自适应方法AdaptNNS.采集数据库中的被检索向量并对采样结果进行聚类,利用聚类中心向量和最近邻分类器提取查询负载特征,同时将查询负载特征与不同的召回率相结合作为输入特征训练梯度提升决策树(GBDT)模型.在查询处理过程中,根据应用程序指定的召回率获取最终输入特征,并通过GBDT模型预测最优搜索参数,提升ANNS算法的吞吐量.在Text-to-Image、DEEP和Turing-ANNS数据集上的实验结果表明,当达到相同的目标召回率时,AdaptNNS方法相比于Baseline方法最多可将DiskANN和HNSW算法的吞吐量提升1.3倍,具有更高的近似最近邻搜索效率.
文献关键词:
近似最近邻搜索;近邻图;参数自适应;聚类;梯度提升决策树
作者姓名:
甘红楠;张凯
作者机构:
复旦大学 软件学院,上海 200438;复旦大学 计算机科学技术学院,上海 200438
文献出处:
引用格式:
[1]甘红楠;张凯-.参数自适应下基于近邻图的近似最近邻搜索)[J].计算机工程,2022(09):28-36
A类:
ANNS,AdaptNNS,DiskANN,HNSW
B类:
参数自适应,近邻图,近似最近邻搜索,向量组,织成,图结构,召回率,搜索效率,自适应方法,采集数据,聚类中心,心向,最近邻分类,分类器,输入特征,梯度提升决策树,GBDT,查询处理,应用程序,最优搜索,吞吐量,Text,Image,DEEP,Turing,Baseline
AB值:
0.222861
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。