Pseudo-Random-Function

差分隱私:為什麼dddelta行號可以忽略不計?

  • April 27, 2020

差分隱私的定義說一個算法 $ M $ 是 $ (\epsilon,\delta) $ - 差分私有如果

$$ P(M(x \in D) \in S)\leq e^\epsilon P(M(x \in D’)\in S) + \delta $$ 在哪裡 $ D,D’ $ 相差一行並且 $ \delta $ 是 $ \text{negligible} $ 在數據庫行數中,所以 $ \delta< \frac{1}{p(n)} $ 和 $ n $ 是數據庫行數;我們為什麼要服用 $ n $ 作為這個微不足道的函式的參數?

$ \varepsilon $ -差分隱私是絕對的:對於任何一對數據庫,您只能獲得關於單個個體的少量機率資訊。當您在數據庫中添加或刪除個人時,算法的所有可能輸出都可能以相似的機率出現。

相比之下, $ (\varepsilon,\delta) $ -差分隱私有時會導致此過程失敗:您可以有一個輸出發生在 $ \delta>0 $ 如果個人在場,則機率,否則永遠不會發生。如果您非常倒霉,並且此輸出來自您的算法,則攻擊者可以知道有問題的個人在集合中。

現在,這種情況多久發生一次?數據集中有多少使用者處於危險之中?好吧,每個使用者都有一個 $ \delta $ 這可能發生在他們身上的可能性。所以平均而言,這會發生 $ \delta \cdot n $ 次(參數二項式定律的預期值 $ (n,\delta) $ ).

你要 $ \delta \cdot n $ 要小,因為您不想讓任何使用者處於危險之中。如果 $ \delta=\frac{1}{100\cdot n} $ ,您可以說“有 99% 的可能性,這種糟糕的情況不會發生”。但如果 delta 在 $ n $ ,那麼平均而言,你的算法會讓一些使用者面臨風險 $ n $ 成長。

引用自:https://crypto.stackexchange.com/questions/44299