首站-论文投稿智能助手
典型文献
基于多粒度语义交互的无监督法律裁判文书检索
文献摘要:
随着法律文书数据越来越多,信息过载问题日益严重,快速且准确地在海量法律文书中进行检索显得非常必要.法律文本作为一种特殊的文本形式,具有篇幅较长、结构复杂、专业性强等特点,传统基于关键字的文本检索方法不能满足用户查询法律信息的需求,容易出现答非所问、检索不全等问题.此外,基于语义的文本检索方法,大多依赖于对含有大量标注数据的法律文本进行有监督学习,而法律文本数据的人工标注则严重依赖专家知识,导致其需要高昂的人力成本.该文提出一种基于无监督学习的法律文书检索模型,分别从法律概念、词语和词组3个方面进行多粒度无监督文本匹配,避免了没有训练数据导致的冷启动问题.在法律裁判文书数据集上进行检索实验的结果表明,与基准模型相比,该模型在MAP、MRR和NDCG@10指标上均有显著提升,取得了优秀的检索效果,具有有效性和先进性.
文献关键词:
无监督学习;文本检索;法律文书检索;多粒度语义交互
作者姓名:
周献杭;申妍燕
作者机构:
中国科学院深圳先进技术研究院 深圳 518055
文献出处:
引用格式:
[1]周献杭;申妍燕-.基于多粒度语义交互的无监督法律裁判文书检索)[J].集成技术,2022(02):55-66
A类:
多粒度语义交互,法律文书检索
B类:
监督法,裁判文书,着法,信息过载,过载问题,日益严重,进行检索,法律文本,文本形式,有篇,篇幅,关键字,文本检索,检索方法,满足用户,答非所问,有监督学习,文本数据,专家知识,高昂,人力成本,无监督学习,检索模型,法律概念,词语,词组,文本匹配,训练数据,冷启动问题,MAP,MRR,NDCG
AB值:
0.319193
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。