典型文献
融合迁移学习与文本增强的中文成语隐喻知识识别与关联研究
文献摘要:
[目的]识别中文成语情感隐喻,构建融合字面外在事物(源域知识)以及隐喻使用者内在态度或情感(目标域知识)的成语知识图谱.[方法]提出一套融合迁移学习和文本增强的成语情感隐喻知识识别方案.首先,爬取成语及其外在事物类别获取外部知识;随后,迁移情感词典获取学习语料,将成语集和情感词典匹配到的成语用于第一轮迁移学习,将情感词典中除首轮测试集的所有情感词作为训练集进行第二轮迁移;引入汉语知识增强文本数据克服成语隐喻特征所导致的弱情感语义,对比BERT嵌入的[CLS]与平均池化方案,采取主流深度学习模型进行验证;归纳最优模型对未匹配的成语进行层次分类并将其与匹配到的合并获得成语内部知识.[结果]平均池化的准确率相较[CLS]提升4.69个百分点,加入成语释义使准确率提升超过13个百分点;第二轮迁移的各级情感精度多在80%以上,原先语料规模较小的情感类别提升最高可达6.25个百分点.[局限]受限于部分情感类别语料数量,分类精度有待提升.[结论]本文方案能够有效识别成语的情感隐喻知识,内外知识的关联为成语知识服务打下了基础.
文献关键词:
成语知识图谱;隐喻知识;迁移学习;文本增强;多层情感分类
中图分类号:
作者姓名:
张卫;王昊;陈玥彤;范涛;邓三鸿
作者机构:
南京大学信息管理学院 南京210023;江苏省数据工程与知识服务重点实验室 南京210023
文献出处:
引用格式:
[1]张卫;王昊;陈玥彤;范涛;邓三鸿-.融合迁移学习与文本增强的中文成语隐喻知识识别与关联研究)[J].数据分析与知识发现,2022(02):167-183
A类:
中文成语,隐喻知识,成语知识图谱,多层情感分类
B类:
迁移学习,文本增强,关联研究,情感隐喻,字面,面外,源域,目标域,爬取,其外,外部知识,移情,情感词典,习语,配到,语用,第一轮,首轮,测试集,有情,词作,训练集,第二轮,知识增强,文本数据,隐喻特征,情感语义,BERT,CLS,平均池化,深度学习模型,最优模型,层次分类,内部知识,百分点,释义,准确率提升,原先,语料规模,规模较,情感类别,受限于,分类精度,别成,知识服务
AB值:
0.324162
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。