典型文献
基于Hadoop的并行化命名实体识别模型研究
文献摘要:
针对现有命名实体识别存在数据处理效率低的问题,该文提出了一种并行化Block-BAC模型.提出了前处理中的数据分块优化算法,并基于Hadoop实现并行化的运作机制;采用局部注意力优化机制,有效减少模型的隐层节点.与已有的BERT-BAC模型相比,在确保较高F1值(精确率和召回率的调和平均数)的情况下,该模型训练时间和实体识别时间分别缩短60.36%、39.43%,具有更广泛的实用性.
文献关键词:
命名实体识别;数据分块;Hadoop;并行化;局部注意力
中图分类号:
作者姓名:
蔡伊娜;包先雨;林燕奎;彭锦学;彭智彬;林泳奇;李俊霖;郭云
作者机构:
深圳市检验检疫科学研究院,广东 深圳 518045;深圳海关食品检验检疫技术中心, 广东 深圳 518045;深圳海关信息中心,广东 深圳 518045
文献出处:
引用格式:
[1]蔡伊娜;包先雨;林燕奎;彭锦学;彭智彬;林泳奇;李俊霖;郭云-.基于Hadoop的并行化命名实体识别模型研究)[J].实验技术与管理,2022(02):7-12,39
A类:
B类:
Hadoop,并行化,命名实体识别,识别模型,有命,别存,处理效率,Block,BAC,前处理,数据分块,运作机制,局部注意力,优化机制,隐层节点,BERT,精确率,召回率,调和平均,平均数,模型训练,训练时间
AB值:
0.365864
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。