典型文献
满足差分隐私的一种频繁序列挖掘算法
文献摘要:
在这个大数据时代,无论是数据量还是数据种类都在以极快的速度增长,因此数据挖掘技术在各行各业(例如移动轨迹预测、广告投递、医疗诊断等方面)中都得到了广泛的运用.频繁序列挖掘是数据挖掘领域中的一个重要方向,但是在挖掘过程中和发布序列数据时很有可能会泄露一些用户的隐私信息,产生严重的安全隐患.Dwork等人提出的差分隐私模型可以为数据挖掘的隐私保护提供安全保证,与传统的隐私保护方法(基于k-匿名及其扩展分组模型)相比,该模型通过添加噪音对数据进行扰动,即使攻击者拥有最大的背景知识也能达到差分隐私保护的目的.文章设计了一种渐进式序列挖掘差分隐私保护算法,该算法通过改进的稀疏向量技术实现对挖掘过程添加拉普拉斯噪音,并对候选频繁序列的真实支持度以及阈值进行扰动.算法在理论角度被证明满足差分隐私,在真实数据集上的实验结果表明该算法具有较好的可用性.
文献关键词:
频繁模式;序列数据;差分隐私;拉普拉斯噪音;稀疏向量技术
中图分类号:
作者姓名:
李玉伟;杨庚
作者机构:
南京邮电大学 计算机学院、软件学院、网络空间安全学院,江苏 南京 210023;江苏省大数据安全与智能处理重点实验室,江苏 南京 210023
文献出处:
引用格式:
[1]李玉伟;杨庚-.满足差分隐私的一种频繁序列挖掘算法)[J].计算机技术与发展,2022(05):99-105
A类:
Dwork,稀疏向量技术,拉普拉斯噪音
B类:
序列挖掘,挖掘算法,数据量,极快,度增长,数据挖掘技术,移动轨迹,轨迹预测,广告,投递,医疗诊断,序列数据,隐私信息,保护方法,匿名,攻击者,背景知识,差分隐私保护,渐进式,加拉,实支,支持度,真实数据,可用性,频繁模式
AB值:
0.252008
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。