首站-论文投稿智能助手
典型文献
结合BiLSTM+CRF和TextRank的句法边界分析
文献摘要:
通过剖析短语结构层次句法分析的层次性和汉语结构特点,提出了一种把核心词作为词块的形式替换、层层进行词块组合的句法结构树.在句法边界分析的过程中,将词块识别和核心词提取分开进行.在词块识别模块,使用双向长短期记忆模型(Bi-directional Long Short-Term Memory,BiLSTM)和条件随机场(Conditional Random Field,CRF)结合的模型(BiLSTM+CRF)进行词块边界标记的识别,其中BiLSTM模型学习上下文特征,CRF模型学习输出标记序列结果的转移特征,达到预测标记序列联合解码的作用;在核心词提取模块,结合Word2vec词向量改进TextRank重要度排序算法,通过加入词语的相似度信息、位置信息、词性信息来提高识别准确度.实验对比了CRF、BiLSTM、BiLSTM+CRF词块识别分别与三种信息组合的Tex-tRank核心词识别的句法边界分析效果,并对比了各句长下每种模型的识别情况.结果表明,使用BiLSTM+CRF联合改进的TextRank识别效果最好,相比于基线LR方法F1值提升了6.58个百分点,整句正确率提升了3.68个百分点,验证了模型的有效性和稳定性.
文献关键词:
词块识别;核心词提取;条件随机场;双向长短期记忆模型;TextRank
作者姓名:
杨陈菊;邵玉斌;孙俊;龙华;皮乾东
作者机构:
昆明理工大学 信息工程与自动化学院,昆明650500;昆明理工大学 云南省计算机国家重点实验室,昆明650500
引用格式:
[1]杨陈菊;邵玉斌;孙俊;龙华;皮乾东-.结合BiLSTM+CRF和TextRank的句法边界分析)[J].小型微型计算机系统,2022(07):1394-1400
A类:
词块识别,核心词提取,tRank
B类:
BiLSTM+CRF,TextRank,边界分析,短语,结构层次,句法分析,层次性,词作,层进,句法结构,构树,取分,开进,识别模块,双向长短期记忆模型,directional,Long,Short,Term,Memory,条件随机场,Conditional,Random,Field,界标,模型学习,上下文特征,学习输出,转移特征,解码,取模,Word2vec,词向量,重要度,排序算法,词语,位置信息,词性,实验对比,信息组,句长,别情,LR,百分点,整句
AB值:
0.326189
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。