首站-论文投稿智能助手
典型文献
中文问句的形式分类和资源建设
文献摘要:
该文归纳了问句形式在问句语料筛选中的作用,探索了问句分类必需的形式特征,同时通过人工标注建设了中文问句分类语料库,并在此基础上进行了基于规则和统计的分类实验,通过多轮实验迭代优化特征组合形成特征规则集,为当前问答提供形式上的分类基础.实验中,基于优化特征规则集的有限状态自动机可实现宏平均F1值为0.94;统计机器学习中随机森林模型的分类效果较好,F1值宏平均达到0.98.
文献关键词:
疑问句;分类;形式特征;语料库
作者姓名:
黎江涛;饶高琦
作者机构:
北京语言大学汉语国际教育研究院,北京100083
文献出处:
引用格式:
[1]黎江涛;饶高琦-.中文问句的形式分类和资源建设)[J].中文信息学报,2022(07):69-76
A类:
B类:
资源建设,选中,问句分类,形式特征,语料库,基于规则,多轮,迭代优化,特征组合,形成特征,规则集,问答,有限状态自动机,统计机器学习,随机森林模型,分类效果,疑问句
AB值:
0.432987
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。