拉普拉斯分布的特征函数推导,拉普拉斯分布概率密度函数
在最近的差分隐私研究中,首先用java实现了mhdjm分发,并制作了Hive交互接口。后来我用python画图,准备做一个非交互的数据发布。
我简单介绍一下差分隐私的原理。苹果用它来实现信息安全。这里有一个例子来帮助理解。考虑一个医疗数据场景:
上图显示了一个医疗数据集D,其中的每条记录都表明了一个患者是否患有癌症。当数据集发布为科研数据或社会调查时,他只为用户提供前n行的统计查询服务。这里选择了count query,用count (n)表示前n行有多少人得了癌症。
这里攻击者A知道Jack排在第三行(医疗数据记录一般是按照一定的顺序排列的,比如身份证号等。),而且由于不能直接访问D(注意D只提供count (n)查询服务),A一开始并不知道Jack的第二列属性值是否为1,但是A可以通过下面的攻击获取Jack的个人隐私信息(是否患有癌症):count(3)-count (2)。
那么在这种情况下差分隐私技术是如何保证信息安全的呢?我们可以把删除Jack的数据集(或修改)看作D’,要求A根据D’得到的计数值的概率分布与D’得到的相似。假设count (3)的输出可能来自{1.5,2},那么count(2)以近似概率输出{1.5,2}中的任意值,拉普拉斯机制可以实现这个功能。-DP的值用于控制概率分布的相似性。当它更小时,exp()更接近于1。
Mhdjm分布图:
代码就不说废话了,java代码:
【java】查看纯文本import org . Apache . commons . math 3 . distribution . laplace distribution;doublelaplaceMechanismCount(longrealCountResult,double epsilon){ LaplaceDistributionld=newLaplaceDistribution(0,1/epsilon);double noise=LD . sample();returnrealCountResult噪音;} python代码:
[python]查看纯文本importnumpyasnploc,scale=0。1.s=np.random.laplace (loc,scale,1) ss=s [0] printss其中和scale调整保护的大小。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。