汉语水平考试(HSK)阅读文本可读性自动评估研究|杜月明;王亚敏;王蕾|北京语言大学汉语速成学院北京 100083 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

首站-论文投稿智能助手

首页

期刊导航

职称导航

中图分类号

典型文献

汉语水平考试(HSK)阅读文本可读性自动评估研究

文献摘要：

本文基于汉语二语文本可读性的特征集合,通过对比六种机器学习模型的效果,引入特征选择算法,实现了汉语水平考试(HSK)阅读文本可读性的自动评估.实验结果表明,支持向量机模型在HSK阅读文本可读性评估中的表现最好;基于汉字、词汇、句法和篇章的全特征模型的预测准确率达0.876;不同层面的特征预测能力存在差异,其中词汇层面表现最好;剔除冗余特征后,词汇和汉字两个层面的18个特征进入最优模型,句法和篇章特征未能进入该模型.本研究对HSK阅读文本的选择和改编及其他类型的文本可读性评估具有一定的参考意义.

文献关键词：

文本可读性;HSK阅读文本;语言特征;机器学习;支持向量机

中图分类号：

[1] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391）

[2] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391） / 文字信息处理（TP391.1）

[3] 语言、文字（H） / 语言学（H0） / 应用语言学（H08） / 数理语言学（H087）

作者姓名：

杜月明;王亚敏;王蕾

作者机构：

北京大学对外汉语教育学院北京 100871;北京语言大学汉语速成学院北京 100083

文献出处：

语言文字应用

引用格式：

[1]杜月明;王亚敏;王蕾-.汉语水平考试(HSK)阅读文本可读性自动评估研究)[J].语言文字应用,2022(03):73-86

A类：

B类：

汉语水平考试,HSK,阅读文本,文本可读性,自动评估,评估研究,汉语二语,特征集合,六种,机器学习模型,特征选择算法,支持向量机模型,汉字,句法,全特征,特征模型,预测准确率,特征预测,预测能力,中词,词汇层面,冗余特征,最优模型,改编,语言特征

AB值：

0.308602

相似文献

基于因子分析的中文学习者低分段作文语言特征研究

王玲;孙金华-南京大学文学院,江苏南京210023;国防科技大学国际关系学院,江苏南京210023

学术语言与科普语言

曲安京-西北大学科学史高等研究院

结合深度学习和语言难度特征的句子可读性计算方法

唐玉玲;张宇飞;于东-北京语言大学信息科学学院,北京 100083

一种基于情感特征表示的跨语言文本情感分析模型

徐月梅;施灵雨;蔡连侨-北京外国语大学信息科学技术学院,北京 100089

基于有序多任务学习的司法二审判决预测方法

韩晓晖;王文同;宋连欣;刘广起;崔超然;尹义龙-齐鲁工业大学(山东省科学院)山东省计算中心(国家超级计算济南中心),山东济南 250014;山东省计算机网络重点实验室,山东济南 250014;山东大学软件学院,山东济南 250101;山东财经大学计算机科学与技术学院,山东济南 250014

一种融合义原的中文摘要生成方法

崔卓;李红莲;张乐;吕学强-北京信息科技大学信息与通信工程学院,北京100101;北京信息科技大学网络文化与数字传播北京市重点实验室,北京100101

基于子词级别词向量和指针网络的朝鲜语句子排序

闫晓东;解晓庆-中央民族大学信息工程学院,北京 100089;国家语言资源监测与少数民族语言中心,北京 100089

学习策略和自我效能感对HSK成绩的影响研究

崔维真;胡天翊-上海杉达学院教育学院,上海201209;上海师范大学教育学院,上海200234

基于多维语言学特征变量的汉语二语者写作水平评价研究

张漫莉-北京语言大学国际学生教育政策与评价研究院,北京 10083

国际中文教育的文本可读性研究回顾

张庆翔;张莹-上海大学文学院,上海 200436

《国际中文教育中文水平等级标准》的中国特色和解读应用

刘英林;李佩泽;李亚男-北京语言大学;汉考国际教育科技(北京)有限公司;北京语言大学语言科学院汉考国际教育科技(北京)有限公司

简评20世纪后期北语一批标志性研究成果

王蕾;赵琪凤;蒋荣-北京语言大学汉语国际教育学部汉语速成学院;北京语言大学国际学生教育政策与评价研究院;北京语言大学语言认知科学学科创新引智基地

文本可读性公式研究发展阶段及特点

王蕾-100083 北京语言大学汉语速成学院

拼音对汉语二语初学者汉语阅读作用的眼动追踪研究

于秒;孙会;逄小婷-300387 天津师范大学心理学部

基于语法丰富性的汉语二语写作质量分析研究

程勇-264025 鲁东大学文学院

汉语二语课堂合作共建的个案研究

王乐;吴思娜-100089 北京外国语大学中国语言文学学院

基于大数据的"一带一路"沿线国家中文学习关注度研究

何山华;杨晓春-扬州大学外国语学院,江苏扬州 225127

汉语二语学习者口语产出的任务复杂度效应研究

吴继峰;高敏;赵晓娜-首都师范大学国际文化学院;北京市和平街第一中学;童趣出版有限公司

菲律宾中文教育发展报告(2019)

章石芳-福建师范大学海外教育学院,福建福州 350117

中高级韩国汉语学习者口语能力评价研究

马庆;柴省三-北京语言大学国际学生教育政策与评价研究院,北京100083

机标中图分类号，由域田数据科技根据网络公开资料自动分析生成，仅供学习研究参考。