首站-论文投稿智能助手
典型文献
增强语义表示的中文金融评价要素抽取
文献摘要:
中文金融评价文本是了解金融行情和判断金融行业繁荣程度的主要载体,对其中的评价要素进行抽取和分析可以在一定程度上的帮助决策者做出判断.传统的抽取方法更侧重于寻找规则,工作量大,且在句子复杂或者不规范的情况下,难以充分考虑句子的句法特征.为了解决该问题,本文构建BBG-BMC模型,利用基于图自注意力机制的混合词编码模型BBG(BERT-BiLSTM-GAT)进行词语编码,在经典的BiLSTM-CRF模型中增加自注意力机制(BiLSTM-多头自注意力机制-CRF,BMC)进行序列标注.该模型的特点是:1)通过图自注意力网络(GAT)建模并利用词语之间的句法依存关系,增强词语语义学习;2)融合词语的上下文信息、词语的局部语义信息、词语之间的句法关系信息,弥补金融词汇在BERT预训练模型上语义表示不够充分的问题;3)对评价单元的三要素<评价对象、情感程度、评价词>联合抽取,扩大评价单元抽取的应用场景;4)使用序列标注的评价单元抽取思想,以混合词编码(BBG)、双向长短期记忆网络(BiLSTM)、条件随机场(CRF)与多头自注意力机制(MHSA)为组件,提升评价单元抽取效果.在中文金融文本数据集上对BBG-BMC模型进行评测,结果表明,本文的模型比最先进的模型BiLSTM-CRF取得了6.75%的F1值提升.
文献关键词:
中文金融评价文本;评价要素抽取;图自注意力网络;双向长短期记忆网络
作者姓名:
陈启;刘德喜;万常选;刘喜平;鲍力平
作者机构:
江西财经大学 信息管理学院,南昌330032
引用格式:
[1]陈启;刘德喜;万常选;刘喜平;鲍力平-.增强语义表示的中文金融评价要素抽取)[J].小型微型计算机系统,2022(02):254-262
A类:
评价要素抽取,中文金融评价文本,图自注意力网络
B类:
断金,金融行业,主要载体,决策者,句子,句法特征,BBG,BMC,BERT,BiLSTM,GAT,词语,CRF,多头自注意力机制,序列标注,用词,句法依存,依存关系,语语,语义学习,上下文信息,语义信息,句法关系,预训练模型,评价单元,三要素,评价对象,联合抽取,双向长短期记忆网络,条件随机场,MHSA,金融文本,文本数据,评测,最先
AB值:
0.220245
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。