典型文献
汉语语法点特征及其在二语文本难度自动分级研究中的应用
文献摘要:
汉语二语文本难度自动分级任务是国际中文教育与计算语言学领域中的一个重要主题.本文依据《国际中文教育中文水平等级标准》,提出了基于语法点多样性与复杂性的25个语法点特征并实现了相关特征的自动抽取与计算,在此基础上构建了 自动分级模型.实验结果表明,融合语法点特征后多元逻辑回归算法的分级准确率为86.40%,比基于现有语言特征的实验提升了 2.4%.进一步研究发现,六级语法点多样性、语法点难度等级均值是区别文章难度级别的关键特征.此外,本文将包含语法点特征在内的207项语言特征融入基于BERT的深度学习模型,取得了 87.6%的准确率,超过了基于传统语言特征的方法和基于神经网络的方法.
文献关键词:
语法点特征;汉语作为第二语言教学研究;文本难度;自动分级
中图分类号:
作者姓名:
朱君辉;刘鑫;杨麟儿;王鸿滨;杨尔弘
作者机构:
北京语言大学信息科学学院 北京 100083;北京语言大学国家语言资源监测与研究平面媒体中心 北京 100083;北京语言大学汉语国际教育研究院 北京 100083
文献出处:
引用格式:
[1]朱君辉;刘鑫;杨麟儿;王鸿滨;杨尔弘-.汉语语法点特征及其在二语文本难度自动分级研究中的应用)[J].语言文字应用,2022(03):87-99
A类:
语法点特征,汉语作为第二语言教学研究
B类:
汉语语法,文本难度,自动分级,分级研究,汉语二语,级任务,国际中文教育,计算语言学,中文水平等级标准,自动抽取,分级模型,合语,多元逻辑回归,逻辑回归算法,比基,语言特征,六级,难度等级,关键特征,BERT,深度学习模型,传统语言
AB值:
0.232987
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。