典型文献
面向知识产权的科技资源画像构建方法
文献摘要:
大数据时代,面向知识产权的科技资源呈现数据规模大、时效性高和价值密度较低等趋势,为有效利用知识产权资源带来严峻的挑战.同时,各个国家对知识产权中隐匿信息挖掘的需求日益增加,使得面向知识产权的科技资源画像构建成为当下的研究热点.目标是通过智能化的数据获取、实体识别以及可视化的方式对知识产权进行画像构建.然而,现有的科技资源画像构建方法只适用于结构化数据,忽略了词语的词性对句子语义理解的影响.因此,提出了一种新颖的面向知识产权的科技资源画像构建算法,针对自动获取的知识产权资源,通过引入词性级别的注意力机制提高实体识别准确率,并以可视化的形式构建知识产权科技资源画像.相比于现有方法,所提出的面向知识产权的科技资源画像构建方法具有以下优势:1)该算法利用词语的词性信息学习句子语义层面的含义,并融合注意力机制,以有监督的方式避免语义理解中的歧义;2)该模型能够智能自动地完成科技数据获取、命名实体识别、科技资源画像构建;3)大量实验结果表明,所提方法利用词语的词性进行有监督学习,在命名实体识别任务中综合性能优于对比算法.
文献关键词:
科技资源画像;实体识别;数据获取;知识产权
中图分类号:
作者姓名:
杨佳鑫;杜军平;邵蓥侠;李昂;奚军庆
作者机构:
智能通信软件与多媒体北京市重点实验室(北京邮电大学), 北京 100876;中华人民共和国司法部信息中心, 北京 100020
文献出处:
引用格式:
[1]杨佳鑫;杜军平;邵蓥侠;李昂;奚军庆-.面向知识产权的科技资源画像构建方法)[J].软件学报,2022(04):1439-1450
A类:
科技资源画像
B类:
画像构建,构建方法,价值密度,中隐,隐匿,信息挖掘,数据获取,结构化数据,词语,词性,对句,句子,语义理解,注意力机制,高实,识别准确率,法利,用词,信息学习,语义层面,歧义,智能自动,成科,命名实体识别,有监督学习,对比算法
AB值:
0.174752
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。