Hmac
確定頻率分析的敏感性
我正在尋找使用鍵控雜湊機制創建一些令牌來代表我們的個人客戶。我計劃在令牌中使用客戶個人資訊(例如
H(Firstname,Surname,DOB)
)的組合來防止頻率分析,但有什麼方法可以量化它嗎?例如,定性地我假設使用:
H(Firstname,Surname,DOB,FirstPurchaseDate)
將比僅使用更安全:
H(Firstname)
因為後者將在給定足夠大的樣本的情況下通過頻率分析來辨識名字的一些值(我必須為此開源協議,所以我假設攻擊者知道令牌包含哪些變數)。我想知道哪些變數組合會使頻率分析變得不切實際 - 是否有任何成熟的技術?
您傳入的任何參數都會影響生成的雜湊值。如果您只計算
H(Firstname)
,那麼兩個具有相同名字的使用者將導致相同的雜湊,即使他們有不同的姓氏。PS 考慮讓使用者簡單地擁有一個
name
,這樣你就可以尊重那些名字不符合英語名字/姓氏模型或其他有問題的過度簡化的人。
有統計模式或分佈。像伽瑪,貝塔,卡方…等。有一個名為 Arena Input Analyzer 的軟體,它將通過卡方檢驗和直方圖向您展示您的數據是如何分佈的。
有了它,我可以隨機創建像你所擁有的數據。但是軟體很貴。我有學生版。