典型文献
政府网站开放公文主题分类自动标注方法
文献摘要:
当前,政府从各层面采取了一系列措施推进政务信息公开,已经取得了阶段性成果.实践工作中,政府网站平台发布的开放公文缺少主题分类、标注不一致问题成为阻碍政务信息开放利用的技术瓶颈.如何精准地、一致地对现有政府平台的海量政务公文进行主题分类标注,使其能为深度检索、推荐服务提供支撑,是亟待解决的关键问题.在深入调研的基础上,一套自动化的针对政府开放公文的主题分类方法被提出,该方法以CNN-LSTM模型为基础,融合预训练BERT模型的语义特征,能精准的对政府开放公文进行主题分类.模型针对主题分类预测的整体准确度(Accuracy)为63.52%,最佳的F1-value可达到63.59%,为解决政务公文主题分类标注缺失问题提供了可行方案.该方法可以与信息检索、推荐结合,为公众提供更具精准度的政府公文服务.
文献关键词:
政策文本;主题分类;预训练BERT模型;标注方法
中图分类号:
作者姓名:
卢小宾;鲁国轩;杨冠灿;祁天娇
作者机构:
中国人民大学信息资源管理学院,北京100872
文献出处:
引用格式:
[1]卢小宾;鲁国轩;杨冠灿;祁天娇-.政府网站开放公文主题分类自动标注方法)[J].档案学通讯,2022(05):19-27
A类:
B类:
政府网站,主题分类,自动标注,标注方法,政务信息,信息公开,阶段性成果,实践工作,网站平台,不一致问题,信息开放,开放利用,技术瓶颈,推荐服务,服务提供,分类方法,预训练,BERT,语义特征,分类预测,Accuracy,value,可行方案,信息检索,政府公文,政策文本
AB值:
0.364654
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。