典型文献
基于机器阅读理解的商品属性识别
文献摘要:
属性抽取的目标是从非结构化文本中抽取与文本实体相关的属性和属性值,然而在电商场景下基于序列标注的模型缺少应对大规模属性抽取任务的可扩展性和可泛化性能力.本文提出基于阅读理解的商品属性抽取模型,通过额外加入问句来强化模型对属性的理解,结合双仿射注意力机制捕获问句和文本之间的语义特征,进一步提高模型的抽取性能.本文在电商数据集上对不同类型问句和不同解码器进行了对比实验,结果表明本文提出的方法优于多个基线模型,相较于OpenTag和SUOpenTag模型,属性抽取的F1值分别提升7.70%和3.26%,未登录词识别的F1值分别提升15.51%和8.12%.
文献关键词:
属性抽取;机器阅读理解;序列标注;大规模
中图分类号:
作者姓名:
张飞宇;马进;贾昊;张世奇;陈文亮
作者机构:
苏州大学 计算机科学与技术学院,江苏 苏州 215006
文献出处:
引用格式:
[1]张飞宇;马进;贾昊;张世奇;陈文亮-.基于机器阅读理解的商品属性识别)[J].山西大学学报(自然科学版),2022(04):924-935
A类:
OpenTag,SUOpenTag
B类:
机器阅读理解,商品属性,属性识别,属性抽取,非结构化,结构化文本,属性值,商场,序列标注,可扩展性,泛化性能,取模,外加,问句,强化模型,仿射,注意力机制,语义特征,电商数据,解码器,基线模型,未登录词
AB值:
0.323793
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。