首站-论文投稿智能助手
典型文献
基于树型门控循环单元的基数和代价估计器
文献摘要:
基数估计和代价估计可以引导执行计划的选择,估计准确性对查询优化器至关重要.然而,传统数据库的代价和基数估计技术无法提供准确的估计,因为现有技术没有考虑多个表之间的相关性.将人工智能技术应用于数据库(artificial intelligence for databases,AI4DB)近期得到广泛关注,研究结果表明,基于学习的估计方法优于传统方法.然而,现有基于学习的方法仍然存在不足:首先,大部分的方法只能估计基数,但忽略了代价估计;其次,这些方法只能处理一些简单的查询语句,对于多表查询、嵌套查询等复杂查询则无能为力;同时,对字符串类型的值也很难处理.为了解决上述问题,提出了一种基于树型门控循环单元,Tree-GRU (tree-gated recurrent unit)的基数和代价估计方法,可以同时对基数和代价进行估计.此外,采用了有效的特征提取和编码技术,在特征提取中兼顾查询和执行计划,将特征嵌入到Tree-GRU中.对于字符串类型的值,使用神经网络自动提取子串与整串的关系,并进行字符串嵌入,从而使具有稀疏性的字符串变得容易被估计器处理.在JOB、Synthetic等数据集上进行了大量实验,实验结果表明,所提模型的各方面性能优于主流算法.
文献关键词:
AI4DB;基数估计;代价估计;查询优化器;Tree-GRU;执行计划
作者姓名:
乔少杰;杨国平;韩楠;屈露露;陈浩;毛睿;元昌安;Louis Alberto GUTIERREZ
作者机构:
成都信息工程大学软件工程学院,四川成都610225;成都信息工程大学管理学院,四川成都610225;北京华为数字技术有限公司,北京100085;深圳大学计算机与软件学院,广东深圳518060;广西教育学院,广西南宁530023;Department of Computer Science,Rensselaer Polytechnic Institute,New York,USA
文献出处:
引用格式:
[1]乔少杰;杨国平;韩楠;屈露露;陈浩;毛睿;元昌安;Louis Alberto GUTIERREZ-.基于树型门控循环单元的基数和代价估计器)[J].软件学报,2022(03):797-813
A类:
AI4DB,字符串嵌入
B类:
树型,门控循环单元,代价估计,估计器,基数估计,执行计划,查询优化器,现有技术,人工智能技术应用,artificial,intelligence,databases,估计方法,能处,语句,嵌套,无能为力,难处,Tree,GRU,tree,gated,recurrent,unit,编码技术,特征嵌入,自动提取,子串,稀疏性,JOB,Synthetic,流算法
AB值:
0.30545
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。