典型文献
基于词信息嵌入的汉语构词结构识别研究
文献摘要:
作为一种意合型语言,汉语中的构词结构刻画了构词成分之间的组合关系,是认知、理解词义的关键.在中文信息处理领域,此前的构词结构识别工作大多沿用句法层面的粗粒度标签,且主要基于上下文等词间信息建模,忽略了语素义、词义等词内信息对构词结构识别的作用.该文采用语言学视域下的构词结构标签体系,构建汉语构词结构及相关信息数据集,提出了一种基于Bi-LSTM和self-attention的模型,以此来探究词内、词间等多方面信息对构词结构识别的潜在影响和能达到的性能.实验取得了良好的预测效果,准确率达77.87%,F1值为78.36%;同时,对比测试揭示,词内的语素义信息对构词结构识别具有显著的贡献,而词间的上下文信息贡献较弱且带有较强的不稳定性.
文献关键词:
汉语构词结构;词信息;语素
中图分类号:
作者姓名:
郑婳;刘扬;殷雅琦;王悦;代达劢
作者机构:
北京大学 计算机学院,北京 100871;北京大学 计算语言学教育部重点实验室,北京 100871
文献出处:
引用格式:
[1]郑婳;刘扬;殷雅琦;王悦;代达劢-.基于词信息嵌入的汉语构词结构识别研究)[J].中文信息学报,2022(05):31-40,66
A类:
汉语构词结构
B类:
词信息,结构识别,意合,词义,中文信息处理,此前,沿用,句法层面,粗粒度,信息建模,语素义,标签体系,信息数据,Bi,self,attention,潜在影响,对比测试,别具,上下文信息
AB值:
0.290338
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。