Random-Number-Generator
關於 NIST SP 800-22 rev 1a 和 erfc 功能中的一些測試
我正在學習 NIST SP 800-22 rev 1a 文件的隨機性測試。
https://csrc.nist.gov/publications/detail/sp/800-22/rev-1a/final
在閱讀的過程中,出現了一些問題,我就這樣提出來了。我的問題是:
- 在 2.2 的塊內頻率測試中,查看 2.2.4 的(3),有一個部分計算如下。 $$ \chi^2(obs)=4M\sum_{i=1}^{N}(\pi_i - 1/2)^2 $$ 我不明白為什麼它在這裡乘以 4。
- 在 2.3 的遊程檢驗中,p 值計算為 $$ P-value = erfc(\frac{|V_n(obs)-2n\pi(1-\pi)|}{2\sqrt{2n}\pi(1-\pi)}). $$ 這里分母的值是多少?我知道 $ 2\pi(1-\pi) $ 是平均值,但我不知道分母是從哪裡來的。
- 是否有任何理由通過 erf 而不是 (2) 中的正態分佈找到 p 值?
謝謝你。
- 這令人擔憂。普通的皮爾遜 $ \chi^2 $ 測試將是 $$ M\sum_{i=1}^n\frac{\left(\pi_i-\frac12\right)^2}{\frac12}=2M\sum_{i=1}^n\left(\pi_i-\frac12\right)^2. $$ 我會想更多,但將含水層丟給 NIST 可能是值得的。
- 應該是標準差。對於獨立的、同分佈的位,執行統計應該是二項分佈的。然後中心極限定理告訴我們,二項式可以近似為正態分佈。但請注意,平方根符號應延伸到 $ \pi(1-\pi) $ 因素。
- erf 函式計算雙尾正態分佈。我們對執行普遍的情況(即有許多連續的 00 和 11 對)和執行不足的情況(即有許多 01 和 10 對的情況)都感興趣。兩者都顯示分佈問題,但由相反的尾部解釋。