使用隱寫術進行數字辨識,能破解嗎?
使用隱寫術進行數字辨識,能破解嗎?
我讀過一些文章,說使用嵌入影片、音頻等的 ID 可以幫助追踪侵犯版權的來源。好的,然後他們說它不能被破壞,所以我有一種*“我會這樣做,只是為了證明你錯了”的*感覺,我就在這裡。
我對使用 OpenCV 庫的影片和圖像有所了解。我知道 OpenCV 可以簡化一些事情,但本質上,圖像是一個矩陣,每個座標都是一個像素,或者更確切地說是一組 RGB 值或一組表示像素顏色的類似值。
因此,根據我收集到的資訊,在隱寫術中,較小的數據塊嵌入到圖像或影片中,並用於各種目的。現在,我假設數據在圖像的 RGB 值甚至影片中的多個圖像中按位分佈,這可用於辨識版權侵權的來源。這一切都很好,只是不要告訴我我不能打破它。
所以理論上說我要盜版電影。如果我通過一種算法執行影片和每一幀,該算法將在給定範圍內添加或減去一個隨機值,不會使影片質量失真超過可接受的量,那應該會完全扭曲隱藏的 ID——對嗎?
將圖像重新格式化為使用除每個像素中的簡單 RGB 值以外的其他格式是否也有助於使 ID 失真而無法辨識?
如果確實可以推斷出侵犯版權的來源,那麼每個副本都必須是唯一可辨識的。我的第一個想法是獲取多個(唯一)副本。然後:
- 逐幀、逐像素地比較不同的副本。
- 對於每個像素,輸出中值像素值。
這根本不應該降低整體質量。這是否會失敗我不知道。
更新:
如果您考慮(1)多個“翻錄”影片和(2)水印區域在空間和時間上沒有完全分開,我認為它不會破壞該計劃。
我的推理最容易用位串來表達。考慮一些帶有相應母版的新電影 $ M=10101100 $ . 接下來,假設有五個帶有唯一水印的副本,每個副本都分配給不同的電影院:
- $ C_0=10101101 $
- $ C_1=10101000 $
- $ C_2=10101110 $
- $ C_3=00101001 $
- $ C_4=01001101 $
假設您使用“中值方法”發布了一個翻錄,假設是翻錄的影片 $ R $ 是:
$ R=00101101 $
將翻錄版本與主副本進行異或運算會產生:
$ R’=M\oplus R=10101100\oplus 00101101=10000001 $
如果將其與分佈式副本進行比較,忽略用於 rip 的方法,很明顯 rip 可能起源於 $ C_0, C_3 $ 和\或 $ C_4 $ . 鑑於使用“中值方法”進行翻錄,您知道: $ C_3 $ 和 $ C_4 $ 都參與和 $ C_1 $ 是無辜的。
通過以區分先前嫌疑人的方式選擇水印,可以在下一個電影發行中使用此資訊。因此,除非您可以完全刪除水印,否則我建議始終可以通過仔細建構嵌入在後續電影中的水印來推斷出裂口的來源。
如果我通過一種算法執行影片和每一幀,該算法將在給定範圍內添加或減去隨機值
$$ .. $$
我認為這不會很好。如果您的失真版本與未加水印的主副本有差異,則生成的輸出將是水印 + 您的噪音。知道水印何時嵌入副本中,您使用的隨機分佈可以通過查看副本中已知無水印部分的雜訊來確定。
將圖像重新格式化為使用除每個像素中的簡單 RGB 值以外的其他格式是否也有助於使 ID 失真而無法辨識?
如果您有 RGB 格式的影片數據,則可能已經進行了顏色轉換。據我所知,RGB 顏色空間被大量使用,因為它是人類描述顏色的一種自然方式。它可以說類似於以 10 為底數而不是以 16 為底數。不使用 RGB 的原因之一與壓縮有關。人類非常善於感知光度的空間差異,顏色則不然。這可以通過縮小顏色通道而不是亮度通道來利用(有損壓縮)。這裡有一個很好的關於使用的顏色格式的概述。