典型文献
基于树状模型的复杂自然语言查询转SQL技术研究
文献摘要:
自然语言查询转SQL(NL2SQL)是指将自然语言表达的查询文本自动转化成数据库系统可以理解并执行的结构化查询语言SQL表达式的技术.NL2SQL可以为普通用户提供数据库查询访问的自然交互界面,从而实现基于数据库的自然问答.复杂查询的NL2SQL是当前数据库学术界的研究热点,主流方法采用序列到序列(Seq2seq)的编解码方式对问题进行建模.然而,已有的工作大多基于英文场景,面向中文领域实际应用时,中文特殊的口语化表达导致复杂查询转化困难;此外,现有工作难以正确输出包含复杂计算表达式的查询子句.针对上述问题,提出一种树状模型取代序列表示,将复杂查询自顶向下分解为多叉树,树结点代表SQL的各组成元素,采用深度优先搜索来预测生成SQL语句.在DuSQL中文NL2SQL竞赛的两个官方测试集中,该方法分别取得了第1名和第2名的成绩,验证了其有效性.
文献关键词:
自然语言查询转SQL;语义解析;自然语言处理
中图分类号:
作者姓名:
赵猛;陈珂;寿黎但;伍赛;陈刚
作者机构:
浙江大学 计算机科学与技术学院,浙江 杭州 310027;浙江省大数据智能计算重点实验室(浙江大学),浙江 杭州 310027;浙江大学 计算机辅助设计与图形学国家重点实验室,浙江 杭州 310027
文献出处:
引用格式:
[1]赵猛;陈珂;寿黎但;伍赛;陈刚-.基于树状模型的复杂自然语言查询转SQL技术研究)[J].软件学报,2022(12):4727-4745
A类:
DuSQL
B类:
树状,自然语言查询,NL2SQL,语言表达,转化成,数据库系统,结构化查询语言,普通用户,数据库查询,自然交互,交互界面,问答,主流方法,序列到序列,Seq2seq,编解码,文场,口语化,作难,子句,种树,代序,序列表示,自顶向下,多叉树,结点,深度优先搜索,语句,测试集,语义解析,自然语言处理
AB值:
0.393845
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。