首站-论文投稿智能助手
典型文献
基于特征融合的中文分词研究
文献摘要:
中文分词是自然语言处理中一项重要的基础任务.由于中文词汇存在多义词、同音字等特殊性,能够准确地完成分词任务是近年来中文分词研究面临的挑战之一.因此,本文提出了一种融合字符特征、拼音特征、五笔输入特征的共享BiL?STM-CRF模型,通过在训练过程中共享LSTM-网络来有效地融合语言特征.经大量数据集实验表明,特征融合能显著提高标记的准确性.在没有利用任何外部词汇资源的情况下,AS和CityU数据集中准确率可分别达到96.9%和97.3%.
文献关键词:
中文分词;拼音;五笔输入;BiLSTM-CRF
作者姓名:
张倩;高建瓴;丁容
作者机构:
贵州大学 大数据与信息工程学院,贵阳550025
引用格式:
[1]张倩;高建瓴;丁容-.基于特征融合的中文分词研究)[J].智能计算机与应用,2022(10):57-61,67
A类:
五笔输入,CityU
B类:
特征融合,中文分词,自然语言处理,文词,多义词,同音字,字符,拼音,输入特征,CRF,训练过程,合语,语言特征,词汇资源,AS,BiLSTM
AB值:
0.304826
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。