典型文献
基于篇章的汉语句法结构树库
文献摘要:
为快速构建一个大规模、多领域的高质树库,提出一种基于短语功能与句法角色组块的、便于标注多层次结构的标注体系,在篇章中综合利用标点、句法结构、表述功能作为句边界判断标准,确立合理的句边界与层次;在句子中以组块的句法功能为主,参考篇章功能、人际功能,以4个性质标记、8个功能标记、4个句标记来描写句中3类5种组块,标注基本句型骨架,突出中心词信息.目前已初步构建有质量保证的千万汉字规模的浅层结构分析树,包含60余万小句的9千余条句型结构库,语料涉及百科、新闻、专利等应用领域文本1万余篇;同时,也探索了高效的标注众包管理模式.
文献关键词:
语料库标注;树库;语块;句法分析
中图分类号:
作者姓名:
卢露;矫红岩;李梦;荀恩东
作者机构:
北京语言大学信息科学学院 北京100083
文献出处:
引用格式:
[1]卢露;矫红岩;李梦;荀恩东-.基于篇章的汉语句法结构树库)[J].自动化学报,2022(12):2911-2921
A类:
千余条,语料库标注
B类:
语句,句法结构,构树,树库,快速构建,短语,组块,多层次结构,标注体系,标点,判断标准,句子,句法功能,篇章功能,人际功能,功能标记,描写,中心词,词信息,质量保证,千万,汉字,分析树,余万,句型结构,百科,万余,余篇,众包,包管,语块,句法分析
AB值:
0.475538
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。