首站-论文投稿智能助手
典型文献
面向分级阅读的分级词表研制
文献摘要:
文章采用计算机自动处理与人工审核相结合的方式,研制了汉语分级词表,分级词表共收录了14459个词语,划分为七个级别.基于大规模教材语料库、童书语料库与网页语料库制定了分级词表的选词规范,选择部分网络词语作为教材文本的补充;根据现有词典知识与汉语构词规则,利用计算机程序自动处理一些候选词语,请专家人工仔细审核部分词语;最后,将所构建的分级词表与义务教育词表、对外汉语词表进行了比较分析,初步验证了分级词表的质量.
文献关键词:
分级阅读;分级词表;词频;语料库
作者姓名:
吴云芳;胡章树;王迎兰
作者机构:
北京大学计算机学院 北京100871;北京大学软件与微电子学院 北京102600;人民教育出版社 北京100089
文献出处:
引用格式:
[1]吴云芳;胡章树;王迎兰-.面向分级阅读的分级词表研制)[J].辞书研究,2022(04):48-60
A类:
分级词表
B类:
分级阅读,自动处理,核相,共收录,七个,教材语料库,童书,网页,分网,网络词语,教材文本,词典,构词,利用计算机,计算机程序,候选词,细审,审核部,分词,义务教育,对外汉语,汉语词,词频
AB值:
0.330467
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。