Terminology
差分隱私公式中機率的含義是什麼?
我不明白“所採用的機率超過 K 的拋硬幣”是什麼意思。
這是否意味著,機率分佈是基於完全相同的數據生成的,但只有函式是隨機選擇的?
所以是數據而不是功能確保了差分隱私,對嗎?
不,這意味著函式是從具有某種機率分佈的某個域中選擇的。這是隨機算法的標準。
為簡單起見,假設有 $ N $ 隨機函式 $ \mathcal{K} $ 可能的,一個人以機率均勻地選擇一個 $ 1/N. $
例如,如果我們將自己限制在次數多項式 $ \leq k $ 超過 $ GF(q), $ 那裡將會是 $ N=q^{k+1} $ 這樣可能的函式,我們通過統一選擇它的每一個來選擇一個函式 $ k+1 $ 座標來自 $ GF(q) $ ,因此有機率 $ q^{-(k+1)}. $
在這種情況下,機率表達式只是意味著 $$ \frac{#{\mathcal{K}: \mathcal{K}(D_1) \in S}}{N}\leq \exp(\epsilon)\frac{#{\mathcal{K}: \mathcal{K}(D_2) \in S}}{N}, $$ 而且當然 $ N $ 可以在這個等式的兩邊抵消。一般來說,分佈當然可能不是完全均勻的。