典型文献
融合句法信息的文本语料库检索方法研究
文献摘要:
[目的]探究高效的大规模文本语料库句法信息检索方法.[方法]依据句法信息特点,将句法信息进行线性化索引,直接提供检索时条件匹配所需的各种信息,从而提升检索速度.[结果]使用《人民日报》语料2 851万句进行实验,26个检索条件平均用时约802.6毫秒,达到大规模语料库检索系统对检索效率的要求.[局限]实验使用的检索条件数量较少,未使用更多的检索条件进行验证.[结论]本文方法有助于在大规模文本语料库中快速地检索词法信息、依存句法信息和成分句法信息.
文献关键词:
依存句法;成分句法;语料库;索引;检索
中图分类号:
作者姓名:
张永伟;刘婷;刘畅;吴冰欣;俞敬松
作者机构:
中国社会科学院大学文学院 北京102488;中国社会科学院语言研究所语料库暨计算语言学研究中心 北京100732;北京大学软件与微电子学院 北京100871
文献出处:
引用格式:
[1]张永伟;刘婷;刘畅;吴冰欣;俞敬松-.融合句法信息的文本语料库检索方法研究)[J].数据分析与知识发现,2022(11):25-37
A类:
成分句法
B类:
句法信息,语料库,库检索,检索方法,信息检索,线性化,索引,人民日报,万句,个检,条件平均,毫秒,检索系统,条件数,词法,依存句法
AB值:
0.291092
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。