首站-论文投稿智能助手
典型文献
基于混合聚类的k-匿名数据发布算法
文献摘要:
为了减少数据发布时的信息损失,针对基于聚类的数据发布匿名方案数据可用性较低等问题,文中提出了一种基于混合聚类的k-匿名数据发布算法.相对于传统的单一聚类方法,该算法将密度聚类和划分聚类相结合,依据数据集的密度特征选取初始聚类中心点,利用划分聚类进行迭代实现最优聚类.此外,该方法剔除了数据集中的部分离群点噪声,减小了其对聚类结果的影响.针对混合型数据记录,采用k-means和k-modes结合的距离度量方式,引入桶泛化算法,减少了泛化操作造成的信息损失.实验结果表明,相较于现有方法,基于混合聚类的k-匿名数据发布算法能够有效降低数据匿名的信息损失,提高数据发布的质量.
文献关键词:
隐私保护;数据发布;k-匿名;聚类;桶泛化算法;混合属性;网络安全;信息损失
作者姓名:
方凯;史志才;贾媛媛
作者机构:
上海工程技术大学 电子电气工程学院,上海201620;上海市信息安全综合管理技术研究重点实验室,上海200240
文献出处:
引用格式:
[1]方凯;史志才;贾媛媛-.基于混合聚类的k-匿名数据发布算法)[J].电子科技,2022(12):78-83
A类:
桶泛化算法
B类:
混合聚类,名数,数据发布,少数据,信息损失,名方,数据可用性,聚类方法,密度聚类,划分聚类,特征选取,初始聚类中心,中心点,离群点,混合型数据,数据记录,means,modes,距离度量,度量方式,匿名的,隐私保护,混合属性
AB值:
0.361507
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。