首站-论文投稿智能助手
典型文献
大规模多粒度中文复述语料库
文献摘要:
[目的/意义]复述是相同语义的不同表达,集中反映了语言的多样性,一直是自然语言处理领域的核心问题.PPDB英文复述数据集在英文自然语言处理的多种任务中得到了应用,推动了英文自然语言处理领域的发展.缺少大规模多粒度中文复述数据集阻碍了复述技术在中文自然语言处理中的应用,是亟待解决的问题.[方法/过程]本文实现了一个针对多源数据的复述抽取系统,并抽取构建了一个大规模中文复述数据集,该数据集具有规模大、质量高的特点,且包含复述短语、复述模板和复述句三种粒度的复述文本.[结果/结论]自动评估和人工评估的结果表明,我们抽取的中文复述数据具有较高的文本多样性和语义一致性.
文献关键词:
中文复述;复述识别;复述抽取
作者姓名:
安波
作者机构:
中国社会科学院民族学与人类学研究所 北京 100081
文献出处:
引用格式:
[1]安波-.大规模多粒度中文复述语料库)[J].情报工程,2022(02):19-33
A类:
中文复述,PPDB,复述抽取,文本多样性,复述识别
B类:
多粒度,述语,语料库,集中反映,自然语言处理,多源数据,短语,自动评估,语义一致性
AB值:
0.11776
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。