典型文献
典籍事件触发动词识别研究:基于《左传》的文本实验
文献摘要:
[目的/意义]事件自动识别抽取是当前典籍主题挖掘研究中一个新的重要课题,其中事件触发词的识别是一项基础的工作,本研究旨在探索古代典籍中事件触发词自动识别和分类的通用方法.[方法/过程]首先运用LDA模型对动词进行主题聚类,归纳典籍事件触发动词的分类体系;并依据聚类结果与分类体系,初步构建触发动词的种子词集.在此基础上,通过语义相似度计算,对种子词集进行扩展,构建典籍事件触发词语义数据集.在实验阶段,以先秦时期的重要典籍《左传》为例,对分类体系构建和种子词集扩展的方法进行验证.[结果/结论]结果表明,本文所提出的典籍事件触发词识别方法可行有效,据此构建的事件触发词集具有较高可信度,未来可进一步扩大实验的样本数量及范围.
文献关键词:
触发词识别;主题聚类;词集扩展;类别体系构建;典籍文本
中图分类号:
作者姓名:
何琳;马晓雯;喻雪寒;艾毓茜;李章超;高丹
作者机构:
南京农业大学信息管理学院 南京210095;南京农业大学人文与社会计算研究中心 南京210095;南京医科大学图书馆 南京210029
文献出处:
引用格式:
[1]何琳;马晓雯;喻雪寒;艾毓茜;李章超;高丹-.典籍事件触发动词识别研究:基于《左传》的文本实验)[J].图书情报工作,2022(05):133-141
A类:
词集扩展,类别体系构建
B类:
事件触发,动词,左传,自动识别,籍主,主题挖掘,索古,通用方法,LDA,主题聚类,分类体系,种子词,语义相似度,相似度计算,词语,先秦时期,触发词识别,可信度,扩大实验,样本数量,典籍文本
AB值:
0.247186
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。