Ciphertext-Only-Attack

是否有可能在不了解該語言的情況下將一種語言翻譯成您自己的語言?

  • September 3, 2013

我知道伏尼契手稿中的文字是一種未知語言,但密碼學家仍在研究它並仍在嘗試破譯它。這是否意味著可以破解任何文字,即使它是您不知道的語言,並且假設您無法使用任何可以翻譯該語言的工具?例如,假設我看到一篇用阿拉伯語寫的文章,這顯然與英語沒有凝聚力。是否可以僅通過單獨編寫那篇文章來翻譯它?如果是這樣,我將如何處理?

自然語言的一個核心假設是概念頻率和構造和表達概念的語法不是均勻和隨機分佈的;因此可以進行模式發現。

但是,很快就會出現兩個問題:

  1. 如果語言樣本(或樣本集合)太小,則模式可能不會清晰和一致。例如,Cretan Linear A 缺乏足夠大的語料庫來支持穩健的模式。
  2. 如果你有一個包含大量模式的體面的語料庫,比如一個 1GB 的自然語言文本塊,那麼該語言可能仍然是封閉的。您可能知道符號是如何關聯的,以及何時應該出現哪些符號,但您仍然需要對人腦有深入的了解,才能將每種模式映射到最可能的人類動機或抽象概念。因此,這種語言應該是人類起源的,沒有明確的意圖來迷惑外行的讀者。

如果我選擇了一本我不懂的語言(比如俄語)的小說並將其轉換為 Wingdings;我的大腦仍然會覺得文本“符合”我與生俱來的書面語言觀念,但不知道為什麼。Ilmari Karonen 是正確的,這個問題本質上是跨學科的。

密碼分析的古玩是,根據數學模型,自然語言*並不安全,但仍然可能完全無法理解,因此產生相同的結果。*這是一些密碼分析家喜歡抓撓的隱秘安全刺激物。:-)

所以是的,有正確的附帶條件是可能的。如果你能用龐大的語料庫破譯一種以前未知的自然語言,但又與所有其他語言無關——你可能會在某方面獲得諾貝爾獎。

答案是肯定的,主要是因為它已經完成了。線性 B、阿卡德語、蘇美爾語和象形文字幾個世紀以來都沒有人知道它們,但我們今天可以翻譯它們。

引用自:https://crypto.stackexchange.com/questions/10130