典型文献
一种基于序列标注的概念短语抽取方法
文献摘要:
[目的/意义]科技文献中的概念是对文献中知识高度凝练的表达,通常以定义句的形式出现在科技文献中.自动从概念定义句中抽取概念,能够进一步挖掘科技文献中蕴含的重要知识.[方法/过程]通过分析概念定义句的结构、句式等模式特征,提出以WCL数据集为基础的语料构建方案,并采用BERT+BiLSTM+CRF模型学习概念定义句的模式,从而实现概念短语抽取.[结果/结论]结合以往对概念定义句模式特征的研究,创新性地提出一种基于序列标注学习概念定义句的组成模式,从而实现概念短语抽取.通过BERT+BiLSTM+CRF模型,有效学习了概念定义句中的上下文语义、句式结构、组成项分布等模式特征,实现了句子中概念短语的抽取.
文献关键词:
序列标注;概念定义句;概念短语;自动抽取
中图分类号:
作者姓名:
李雪思;张智雄;刘欢
作者机构:
中国科学院文献情报中心 北京100190;中国科学院大学经济与管理学院图书情报与档案管理系 北京100190;科技大数据湖北省重点实验室 武汉430072
文献出处:
引用格式:
[1]李雪思;张智雄;刘欢-.一种基于序列标注的概念短语抽取方法)[J].图书情报工作,2022(11):121-128
A类:
概念短语,概念定义句,WCL,BERT+BiLSTM+CRF
B类:
序列标注,科技文献,常以,以定,模式特征,集为,语料,构建方案,模型学习,成模,有效学习,上下文语义,句式结构,句子,自动抽取
AB值:
0.201821
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。