典型文献
实例层数据清洗技术研究
文献摘要:
随着科学、技术和工程的迅猛发展,近20年来,许多领域诸如光学观测、光学监控、健康医护、传感器、用户数据、互联网和金融公司以及供应链系统等都产生了海量的数据(例如,在医疗检测中,数据都是源源不断而来的,形成了"数据灾难").有效的数据分析和数据挖掘建立在数据可用性和数据高质量的基础上,数据高质量的前提是需要对数据进行清洗.数据清洗是对脏数据进行检测和纠正的过程,是进行数据分析和管理的基础,也是常用的提高数据质量的技术.实例层数据清洗是数据清洗的重要组成部分,该文重点对实例层数据清洗技术中属性和重复记录值的检测及清洗方法进行比较和分析总结.介绍了数据清洗技术以电气工程领域、医药领域、交通领域为代表的应用领域结合应用情况,对不同的数据集特点与适用的实例层数据清洗技术提供了有价值的选择建议.最后对实例层数据清洗技术面临的问题与挑战及发展方向进行了展望.
文献关键词:
实例层数据清洗;属性检测;属性清洗;重复记录检测;重复记录清洗
中图分类号:
作者姓名:
胡文瑜;应康辉
作者机构:
福建工程学院 计算机科学与数学学院,福建 福州 350118;福建省大数据挖掘与应用技术重点实验室,福建 福州 350118
文献出处:
引用格式:
[1]胡文瑜;应康辉-.实例层数据清洗技术研究)[J].计算机技术与发展,2022(05):22-28
A类:
实例层数据清洗,属性清洗,重复记录检测,重复记录清洗
B类:
数据清洗技术,光学观测,光学监控,用户数据,金融公司,供应链系统,医疗检测,源源不断,灾难,数据可用性,数据质量,清洗方法,电气工程领域,医药领域,交通领域,结合应用,问题与挑战,属性检测
AB值:
0.204294
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。