首站-论文投稿智能助手
典型文献
基于多源数据融合的公共文化领域词表构建研究
文献摘要:
公共文化云发展迅速,公共文化智慧化模式层出不穷,要对公共文化发展的整体现状进行实时的监测扫描与深入的分析挖掘,需要构建领域的主题词表,以增加分析挖掘的准确性以及数据分析结果的可读性.为此,如何基于政策法规、活动报道等文本内容,生成一部能够反映公共文化领域最新最全的词表,是公共文化大数据建设的一项重要内容.本文搜集了公共文化领域政策法律文件和政府公告、各地文化活动数据、学术论文、新闻报刊,通过自动抽取和人工标注获取其中的术语,采用规则方法、K-means、KNN等多种方法对术语分类,形成术语词典.这部词典初步收录了公共文化相关的19个大类、约2.8万条词条,后续可继续扩展.
文献关键词:
公共文化;术语抽取;术语分类;术语词典
作者姓名:
王晓雪;化柏林
作者机构:
北京大学软件与微电子学院;北京大学信息管理系;公共文化服务大数据应用文化和旅游部重点实验室
文献出处:
引用格式:
[1]王晓雪;化柏林-.基于多源数据融合的公共文化领域词表构建研究)[J].图书馆杂志,2022(10):25-34,96
A类:
公共文化大数据
B类:
多源数据融合,领域词,公共文化云,文化智慧,模式层,公共文化发展,主题词表,加分,可读性,政策法规,文本内容,最全,大数据建设,政策法律,法律文件,政府公告,文化活动,学术论文,闻报,报刊,自动抽取,means,KNN,多种方法,术语分类,术语词典,万条,词条,术语抽取
AB值:
0.402014
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。