首站-论文投稿智能助手
典型文献
PPDM中面向k⁃匿名的MI Loss评估模型
文献摘要:
隐私保护数据挖掘(PPDM)利用匿名化等方法使数据所有者在不泄露隐私信息的前提下,安全发布在数据挖掘中有效可用的数据集.k-匿名算法作为PPDM研究使用最广泛的算法之一,具有计算开销低、数据形变小、能抵御链接攻击等优点,但是在一些k-匿名算法研究中使用的数据可用性评估模型的权重设置不合理,导致算法选择的最优匿名数据集在后续的分类问题中分类准确率较低.提出一种使用互信息计算权重的互信息损失(MI Loss)评估模型.互信息反映变量间的关联关系,MI Loss评估模型根据准标识符和标签之间的互信息计算权重,并通过Loss公式得到各个准标识符的信息损失,将加权后的准标识符信息损失的和作为数据集的信息损失,以弥补评估模型的缺陷.实验结果证明,运用MI Loss评估模型指导k-匿名算法能够明显降低匿名数据集在后续分类中的可用性丢失,相较于Loss模型和Entropy Loss模型,该模型分类准确率提升了0.73%~3.00%.
文献关键词:
隐私保护数据挖掘;k-匿名算法;数据可用性;分类准确率;MI Loss评估模型
作者姓名:
谷青竹;董红斌
作者机构:
武汉大学 国家网络安全学院,武汉 430000
文献出处:
引用格式:
[1]谷青竹;董红斌-.PPDM中面向k⁃匿名的MI Loss评估模型)[J].计算机工程,2022(04):143-147
A类:
B类:
PPDM,匿名的,MI,Loss,隐私保护数据挖掘,匿名化,所有者,隐私信息,计算开销,算法研究,数据可用性,可用性评估,重设,算法选择,匿名数据集,分类问题,分类准确率,互信息,信息损失,关联关系,标识符,Entropy,模型分类,准确率提升
AB值:
0.280206
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。