首站-论文投稿智能助手
典型文献
新能源专利文本术语抽取研究
文献摘要:
专业术语的自动抽取对于领域机器翻译、领域知识图谱等方面均具有重要作用.近年来,新能源领域专利文本的申请量逐年增加,我国科技文献走向世界有了更高需求,专业术语翻译质量直接影响专利文本的翻译质量.为了提高新能源领域专利文本术语抽取结果的准确率和召回率,构建新能源领域术语库以及提高新能源领域专利文本的翻译质量打下基础.本文提出了基于BERT-BiLSTM-CRF的新能源专利术语抽取方法,以自建的3002条新能源领域专利文本作为实验对象,在中文数据集上的实验结果达到了 0.9211的精确率,0.9245的召回率以及0.9228的Fl值.与其他经典深度学习术语抽取模型相比,基于BERT-BiLSTM-CRF的新能源专利术语抽取模型能有效地将新能源领域专利文本中字符较多的长序列术语识别出来,提高术语抽取在实际应用中的效果.
文献关键词:
术语抽取;新能源专利;BERT;BiLSTM;CRF
作者姓名:
孙甜;陈海涛;吕学强;游新冬
作者机构:
北京信息科技大学网络文化与数字传播北京市重点实验室,北京100101;北京信息科技大学外国语学院,北京100192
引用格式:
[1]孙甜;陈海涛;吕学强;游新冬-.新能源专利文本术语抽取研究)[J].小型微型计算机系统,2022(05):950-956
A类:
新能源专利
B类:
利文,术语抽取,专业术语,自动抽取,机器翻译,领域知识图谱,能源领域,申请量,科技文献,走向世界,高需求,术语翻译,翻译质量,召回率,术语库,打下基础,BERT,BiLSTM,CRF,实验对象,中文数据集,精确率,Fl,取模,字符,术语识别
AB值:
0.261278
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。