Index-of-Coincidence

重合指數的期望值

  • June 28, 2012

誰能告訴我為什麼巧合指數的期望值如下?

對於長度為的密文字元串 $ L $ , 在哪裡 $ n $ 是字母字元的數量, $ k_r = 1/n $ , 和 $ k_p = \sum_{i=1}^n p_i^2 $

$$ E(IC) = \frac{1}{t}*\frac{L - t}{L - 1}k_p + \frac{t - 1}{t}\frac{L}{L - 1}*k_r $$


我忘了說 $ t $ 是用於加密消息的多字母密碼的周期。

預期巧合指數通常是指一種語言的預期巧合指數(英語為 1.73,如果不進行規範化,則為 0.067)。

有問題的公式通常用於確定密鑰的長度( $ t $ )給定(測量) $ IC $ 收到的密文。 $ IC $ 是從密文中隨機選擇的兩個字母相同的機率。

讓 $ X={ x_1,x_2,x_3,…x_L} $ 成為密文。如果我們認為多字母密碼有周期 $ t $ ,那麼我們會期望以下各項:

$$ \begin{eqnarray} & X_1 ={x_1, x_{t+1},x_{2t+1},…}\ & X_2 ={x_2, x_{t+2},x_{2t+2},…}\ & \vdots \ &X_t ={x_t, x_{2t},x_{3t},…} \end{eqnarray} $$ 顯示與明文相同的索引 ( $ \kappa_p $ )。所以我們可以重構 $ IC(X) $ 如下。隨機選擇兩個字母,我們想要它們匹配的機率。

它們處於同一位置的機率 $ X_i $ 是:

$$ \frac{tC(\frac{L}{t},2)}{C(L,2)} = \frac{L*(\frac{L}{t}-1)}{L(L-1)} $$ 他們不同的機率 $ X_i $ s 是:

$$ \frac{C(t,2)\frac{L}{t}\frac{L}{t}}{C(L,2)} = \frac{t(t-1)\frac{L}{t}\frac{L}{t}}{L(L-1)} $$

  • 如果他們在同一個 $ X_i $ 然後它們都使用相同的字母進行加密:所以機率是 $ \kappa_p $
  • 如果他們在不同的 $ X_i $ s 然後它們使用不同的字母進行加密,所以我們可以假設它們是隨機分佈的:所以機率是 $ \kappa_r $

所以兩個隨機字母匹配的機率大約是

$$ \begin{eqnarray} IC(X) & \approx \frac{L*(\frac{L}{t}-1)}{L(L-1)}\kappa_p + \frac{t(t-1)\frac{L}{t}\frac{L}{t}}{L(L-1)}\kappa_r\ & = \frac{(L-t)}{t(L-1)}\kappa_p + \frac{(t-1)*L}{t(L-1)}\kappa_r \end{eqnarray} $$

引用自:https://crypto.stackexchange.com/questions/3039