Differential-Privacy
每條記錄的不同隱私
通常,差分隱私以互動方式向查詢結果添加雜訊,例如總和或平均值。
有什麼方法可以實現差分隱私,以便以非互動方式添加噪音,逐條記錄?
提前致謝
是的,典型的例子是隨機響應:當使用敏感的是/否問題進行調查時(例如,“您目前是居住在美國的無證移民”),您要求每個受訪者先擲硬幣。如果硬幣碰到反面,你告訴他們隨機回答(通過擲第二個硬幣),否則,請他們誠實回答。然後,您刪除 25% 的“是”答案以考慮隨機回答的人,您會得到一個具有不同隱私的嘈雜總數。
它對應於這種“為每條記錄添加噪音”而不是為最終結果(在本例中為非法移民總數)添加噪音的想法。主要優點是您不需要擁有所有“真實”數據的可信第三方。主要缺點是對於相同的隱私屬性,結果雜訊更大。
您可以使用這種隨機響應的想法計算更複雜的統計數據。例如,諸如“哪些網站最常用作 Google Chrome 中的首頁”之類的內容是使用RAPPOR計算的。該方法在他們的論文中有所描述。
最近,Vincent Bindschaedler、Reza Shokri 和 Carl Gunter 詳細介紹了一種從真實數據生成合成數據集的通用方法,並具有不同的隱私保證。這並不完全是“逐條添加雜訊記錄”,但它類似於發布不僅僅是雜訊統計數據,而是可用於數據探勘的完整數據集的想法。