Algorithm-Design

執行香農熵分析時選擇符號位長度和視窗大小的方法是什麼?

  • April 19, 2022

在對 RNG 或文件等內容執行香農熵分析時,您必須:

  1. 選擇一個符號位長度和样本數將一次執行分析(IE:視窗大小)
  2. 讀取輸入直到視窗已滿
  3. 對收集的符號執行直方圖
  4. 獲取直方圖輸出併計算香農熵
  5. 通過獲取全新的樣本或滑動視窗重複步驟 2(即:保留一部分已使用的樣本)

諸如此類的工具binwalk會在後台自動執行此操作,並且在顯示文件的不尋常部分方面做得很好;但是,尚不完全清楚它們是如何:

  • 選擇符號位長
  • 選擇視窗大小
  • 如果執行任何視窗滑動

是否有在 RNG 和文件分析的背景下選擇這些值的方法?

利亞姆,你的問題仍然是一個懸而未決的問題。在一般情況下,沒有用於計算**文件熵的標準化方法。**甚至 NIST 在他們的非 IID 800-90B 計算中也這麼說。以下問題是用來說明問題的修辭性問題:-

  1. 符號位長是多少?誰知道。莎士比亞的作品有線條、行為和段落的分界線。它們是否包含在您的視窗中?他們使用了可以用霍夫曼程式碼表示的奇怪詞。
  2. 你用什麼直方圖?真的,你的直方圖到底是什麼?
  3. 先前的發現如何加權?

問題不在於窗戶。問題在於對所述視窗的操作和加權。

參閱https://en.wikipedia.org/wiki/Kolmogorov_complexity、http://www.reallyreallyrandom.com/photonic/technical/90b_latest/http://www.reallyreallyrandom.com/photonic/technical/algorithms/並關注連結。

簡而言之,在一般情況下沒有香農熵分析之類的東西:-(

引用自:https://crypto.stackexchange.com/questions/99734