典型文献
基于属性分割的高维二值数据差分隐私发布
文献摘要:
通常随着数据集属性维度的增加,高维数据的差分隐私发布方法所需的时间成本和产生的噪声干扰也会随之增大,尤其是对于高维二值数据很容易被过大的噪声所覆盖.因此,针对高维二值数据的隐私发布问题,提出了一种高效且低噪的发布方法PrivSCBN(differentially private spectral clustering Bayesian network).首先,该方法基于Jaccard距离,使用满足差分隐私的谱聚类算法来划分属性集,然后根据划分的结果来进一步分割原始数据集,从而实现数据的降维.其次,该方法基于动态规划思想并结合指数机制,使用满足差分隐私的贝叶斯网络快速构建算法来为每个分割后的子集构建贝叶斯网络.最后,该方法利用条件概率在二值数据上的取值特点,对从贝叶斯网络中提取的条件分布进行加噪,并通过控制贝叶斯网络的最大入度数来减少其产生的噪声大小.通过在3个真实高维二值数据集上的实验,验证了PrivSCBN方法的高效性与可用性.
文献关键词:
差分隐私;高维二值数据发布;贝叶斯网络;属性划分;动态规划;条件分布
中图分类号:
作者姓名:
洪金鑫;吴英杰;蔡剑平;孙岚
作者机构:
福州大学数学与计算机科学学院 福州 350108;厦门华厦学院信息与智能机电工程学院 福建厦门 361024
文献出处:
引用格式:
[1]洪金鑫;吴英杰;蔡剑平;孙岚-.基于属性分割的高维二值数据差分隐私发布)[J].计算机研究与发展,2022(01):182-196
A类:
PrivSCBN,高维二值数据发布
B类:
数据差分,差分隐私,高维数据,时间成本,噪声干扰,differentially,private,spectral,clustering,Bayesian,network,Jaccard,谱聚类算法,分属,属性集,原始数据,动态规划,规划思想,指数机制,贝叶斯网络,快速构建,子集,法利,条件概率,条件分布,入度,可用性,属性划分
AB值:
0.364119
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。