典型文献
基于语义匹配的多标签多层级中文专利分类
文献摘要:
随着"十四五"规划提出要保护和激励国内产生更多高价值专利,各类跨学科、跨领域的创新型专利申请量激增,专利自动分类方法辅助人工分类的需求日益增长.目前,中文专利分类主要由审查员根据提交的专利内容,与国际专利分类体系表进行人工匹配来确定所属分类,人工效率低.已有的专利自动分类方法主要从专利中提取文本结构特征和语义特征,将两种特征与国际专利分类体系表中的标签直接进行相似度匹配,没有考虑到国际专利分类表中分类标签解释文本的语义信息,容易导致分类模糊.为此,提出一种基于语义匹配的多标签多层级中文专利分类方法,将传统的文本分类问题转化为基于语义特征的文本匹配问题,以实现专利文本多标签多层级分类任务.通过从国际专利分类表中提取各标签各层级(部、大类、小类、大组和小组)的语义特征,同时从公开专利中提取文本语义特征,并将二者进行语义匹配,从而达到 自动分类的目的.在同一数据集上的实验结果显示,该方法能够取得更好的效果.
文献关键词:
语义匹配;IPC标签语义;多标签多层级;中文专利分类;伪孪生网络
中图分类号:
作者姓名:
王文川;朱全银;孙纪舟;马甲林
作者机构:
淮阴工学院计算机与软件工程学院,江苏淮安223003
文献出处:
引用格式:
[1]王文川;朱全银;孙纪舟;马甲林-.基于语义匹配的多标签多层级中文专利分类)[J].微电子学与计算机,2022(04):91-99
A类:
多标签多层级,中文专利分类,多层级分类
B类:
语义匹配,高价值专利,跨领域,新型专利,专利申请量,激增,自动分类方法,助人,工分,审查员,提交,国际专利分类,分类体系,人工效率,文本结构,接进,相似度匹配,分类表,释文,语义信息,文本分类,分类问题,问题转化,文本匹配,匹配问题,利文,分类任务,文本语义特征,一数,IPC,标签语义,伪孪生网络
AB值:
0.261737
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。