為什麼定義在εϵepsilon-差分隱私是乘法而不是加法?
根據其數學定義,隨機算法 $ M: D\rightarrow R $ 滿足 $ \epsilon $ -如果相鄰數據集的差異隱私 $ x, y \in D $ 在哪裡 $ D $ 是一個完整的數據集和數據集 $ x $ 和 $ y $ 只有一個記錄不同,並且任何一組 $ S \in Range(M) $ , $ Pr(M(x) \in S) \leq Pr(M(y) \in S) * e^{\epsilon} $ .
這個問題中顯示了附加的:差分隱私定義。
Dwork 博士在Microsoft Research Lecture 2(大約 2'50’’)中解釋了使用乘法定義相對於加法定義的優勢。簡而言之,通過這種乘法定義,可以排除個人記錄被隨機選擇和發布的可能性。
然而,我很難理解她的意思。我將不勝感激理解這個定義的任何幫助!
簡而言之,通過這種乘法定義,可以排除個人記錄被隨機選擇和發布的可能性。
考慮一個惡意算法 $ M^* $ 從輸入數據庫中選擇一個隨機個人的記錄(大小 $ n $ ) 並輸出它。請注意,這 $ M^* $ 對於良好的差分隱私定義,不應將其視為安全的,因為它會損害隨機個人的隱私。
然而,加性差分隱私定義涉及 $ M^* $ 作為一種安全算法 $ \epsilon=1/n $ . 要看到這一點,請考慮兩個輸入數據庫 $ X,Y $ (無論大小 $ n $ ) 與單個元素不同 $ d $ (在哪裡 $ d\in X $ 但 $ d\not\in Y $ )。那麼,不難看出 $ \Pr[M^(X)\in S]\leq\Pr[M^(Y)\in S]+1/n $ 適用於任何子集 $ S\subseteq R $ , IE, $ M^* $ 滿足添加劑 $ 1/n $ -差分隱私。
標準乘法定義解決了上述問題。請注意,對於 $ S={d} $ , 沒有 $ \epsilon $ 這樣 $ \Pr[M^(X)\in S]\leq\Pr[M^(Y)\in S]\cdot e^\epsilon $ 因為 $ \Pr[M^(X)=d]=1/n>0 $ 和 $ \Pr[M^(Y)=d]=0 $ . 那是, $ M^* $ 不符合標準 $ \epsilon $ -差分隱私。