典型文献
相似重复记录检测研究与发展动态的知识图谱分析
文献摘要:
在大数据环境下,数据库中的记录数量呈指数上升,如何高效率地检测出相似重复记录是数据清洗的关键点和提高数据质量的首要任务.近十年国内外相似重复记录检测方法又涌现出相当多的高水平成果,迫切需要对新的文献加以归纳梳理.以2008—2019年的国内外相似重复记录检测相关文献为研究样本,结合社会网络和知识图谱对其发文量、核心机构、作者合作群、研究热点和研究趋势进行分析.分析发现,作者合作结构整体上较松散,相似重复记录各类检测方式的集成、应用领域的扩展和通用框架的研究成为热点,缺失数据值的处理、多数据源的识别、大数据量的分块处理成为相似重复记录领域的挑战.
文献关键词:
相似重复记录检测;知识合作;研究热点;研究趋势
中图分类号:
作者姓名:
顾晴;董永权;胡杨
作者机构:
江苏师范大学智慧教育学院 江苏 徐州221116
文献出处:
引用格式:
[1]顾晴;董永权;胡杨-.相似重复记录检测研究与发展动态的知识图谱分析)[J].计算机应用与软件,2022(03):1-7,95
A类:
相似重复记录检测,重复记录检测
B类:
研究与发展,发展动态,知识图谱分析,大数据环境下,数据清洗,数据质量,首要任务,涌现出,平成,社会网络,核心机构,研究趋势,较松,检测方式,通用框架,缺失数据,多数据源,大数据量,分块,块处理,知识合作
AB值:
0.260504
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。