首站-论文投稿智能助手
典型文献
基于增量局部加权学习的查询模板自适应基数估计
文献摘要:
基数估计是基于代价查询优化的关键步骤,已经被研究了近40年.传统方法如基于直方图的方法在一些假设如属性相互独立、相交的表满足包含原则等成立时能基本满足准确性要求.然而,在真实运行环境中这些假设往往不再成立,可能导致基数估计严重错误进而造成查询延迟.近年来,随着数据的增多和新硬件的发展,使用机器学习方法来提高基数估计的质量成为了可能.由于基于代价的查询优化主要根据查询中子执行计划的估计代价来选择最优的查询执行计划,因此,有一些最近的工作针对一些关键的子执行计划模板建立相应的局部学习模型,取得了不错的进展.但是,这些局部模型主要用于查询(查询空间)分布和数据(数据库数据)分布不变的场景,而在真实运行环境中,它们往往不断地发生变化,限制了这些估计技术的有效性.在本文中,我们针对子执行计划模板在查询分布和数据分布不断变化的环境下提出了一种使用增量的局部加权学习进行自适应基数估计的方法.具体地说,首先抽取子执行计划的语义和统计特征使之能代表当前查询和数据的特性,然后使用增量的局部加权学习模型根据查询分布和数据分布的变化进行自适应的学习,实现基数估计.最后,通过对比实验验证了本文方法的有效性.
文献关键词:
基数估计;查询优化;执行计划;自适应学习;增量学习;局部加权学习
作者姓名:
冯杰明;李战怀;陈群;陈肇强
作者机构:
西北工业大学计算机学院 西安 710072;西北工业大学大数据存储与管理工业和信息化部重点实验室 西安 710072
文献出处:
引用格式:
[1]冯杰明;李战怀;陈群;陈肇强-.基于增量局部加权学习的查询模板自适应基数估计)[J].计算机学报,2022(01):17-34
A类:
局部加权学习
B类:
基数估计,查询优化,关键步骤,直方图,相互独立,相交,包含原则,立时,运行环境,严重错误,机器学习方法,据查,中子,执行计划,建立相应,局部学习,不错,局部模型,对子,数据分布,具体地说,先抽,统计特征,自适应学习,增量学习
AB值:
0.268834
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。