典型文献
混洗差分隐私下的多维类别数据的收集与分析
文献摘要:
随着大数据时代的到来,如何在保护用户隐私的前提下完成多维类别数据上的频率分布估计问题成为研究热点.已有的工作主要是基于中心化差分隐私模型或本地化差分隐私模型完成安全算法的设计.鉴于上述两种模型在隐私保护程度或发布结果可用性方面的弊端,基于新兴的混洗差分隐私模型,设计用户数据收集策略,进而提供高安全、高可用的频率分布估计服务.考虑到多维类别属性的多维特征以及不同属性上取值域大小不等的异构特点,从扰动算法以及洗牌方式等角度出发,设计了基于单洗牌者以及多洗牌者的数据发布方案ARR-SS和SRR-MS.此外,结合上述两种方案的优势,通过填补技术消除属性间异构问题,提出了基于取值域填补的单洗牌者数据发布方案PSRR-SS.从理论上分析了3种策略的隐私保护程度以及误差级别,并利用4个真实数据集验证所提出方案在频率估计问题上的有效性.此外,将所提方案作为带噪数据库生成技术的加噪组件,评估随机梯度下降算法在生成带噪数据上的训练结果的可用性.实验结果展现了所提方案优于当前同类算法.
文献关键词:
混洗差分隐私;隐私保护;多维类别数据;频率估计
中图分类号:
作者姓名:
刘艺菲;王宁;王志刚;谷峪;魏志强;张啸剑;于戈
作者机构:
中国海洋大学信息科学与工程学部,山东青岛266100;东北大学计算机科学与工程学院,辽宁沈阳110819;河南财经政法大学计算机与信息工程学院,河南郑州450046
文献出处:
引用格式:
[1]刘艺菲;王宁;王志刚;谷峪;魏志强;张啸剑;于戈-.混洗差分隐私下的多维类别数据的收集与分析)[J].软件学报,2022(03):1093-1110
A类:
混洗差分隐私,多维类别数据
B类:
私下,用户隐私,下完,频率分布,分布估计,中心化差分隐私,本地化差分隐私,成安,安全算法,隐私保护,可用性,用户数据,数据收集,高安全,高可用,多维特征,同属,值域,大小不等,洗牌,数据发布,ARR,SS,PSRR,真实数据,数据集验证,提出方案,频率估计,生成技术,随机梯度下降算法
AB值:
0.286497
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。