差分隱私:高斯機制ε>1ε>1epsilon >1, 拉普拉斯機制時ε=0ε=0epsilon = 0
在差分隱私資源中, $ \epsilon, \delta $ 理由不夠充分。
例如,在Wikipedia上,據說高斯機制僅在 $ \epsilon < 1 $ . 然而,任何滿足的高斯機制,例如, $ (0.1, \delta) $ -差分隱私,已經滿足 $ (1, \delta) $ -差分隱私,或 $ (5^{100}, \delta) $ -差分隱私,我說的對嗎?
同樣,在某些資源中,DP 的定義是 $ \epsilon \geq 0 $ ,但隨後聲稱拉普拉斯機制實現了 $ (\epsilon, 0) $ - 任何不同的隱私 $ \epsilon $ . 然而,怎麼樣 $ \epsilon = 0 $ ? 帶密度的拉普拉斯分佈 $ \propto 1/\epsilon $ 在這種情況下沒有定義。我們是否有任何滿足的加法機制 $ (0,0) $ -差分隱私?
編輯:我的理解如下。沒有加性雜訊機制可以實現 DP $ \epsilon = 0 , \delta = 0 $ . 這根本不可能,因為我們添加了一些雜訊(當然,假設靈敏度不是 $ 0 $ 在這種情況下,我們甚至不需要添加噪音)。此外,拉普拉斯機制實現了 DP $ \epsilon>0,\delta = 0 $ , 這意味著任何 $ \epsilon>0,\delta \geq 0 $ 將是可能的。另一方面,高斯機制需要 $ \epsilon, \delta > 0 $ ,所以這並沒有在可行性方面概括拉普拉斯案例中的任何事情(即,什麼是可實現的,什麼是不可實現的)。所以我認為唯一的歧義如下:我們是否有一個加法機制來實現 DP $ \epsilon = 0 $ 和任何 $ \delta > 0 $ ?
在高斯機制的情況下,重要的是區分使用 $ \epsilon $ 參數化高斯分佈及其用於量化差分隱私級別。對於任何 $ 0<\epsilon<1 $ 和 $ 0<\delta<1 $ 我們可以建構增加雜訊分佈的機制 $$ \mathcal N(0,2\log(5/4\delta)(\Delta f)^2/\epsilon^2) $$ 然後我們有一個統計保證,這提供了 $ (\epsilon,\delta) $ -差分隱私,確實 $ (\epsilon’,\delta’) $ - 任何不同的隱私 $ \epsilon’\ge\epsilon $ 和 $ \delta’\ge\delta $ . 但是,如果(例如)我們採取,說, $ \epsilon=2 $ 和 $ \delta=1/2 $ 雖然我們仍然可以構造一個雜訊函式 $$ \mathcal N(0,2\log(5/2)(\Delta f)^2/4), $$ 我們不能用這個定理說我們有 $ (2,0.5) $ -差分安全。維基百科試圖表達使用高斯構造可證明的限制,而不是限制差分隱私的含義範圍。
類似地,在拉格朗日情況下,構造沒有定義為 $ \epsilon=0 $ 因此不能與此參數一起使用。同樣,這是對拉格朗日結構的限制,而不是對差分隱私含義範圍的限制。
按照 $ (0,0) $ -差分隱私,這意味著我們的算法 $ \mathcal A $ 為所有數據集生成相同分佈的輸出。這意味著 $ \mathcal A $ 是獨立於數據集的,不能通過向依賴於數據集的算法添加雜訊來建模。