深偽的離奇進化史:從實驗室小把戲,到一場2,500萬美元的搶劫
深偽技術怎麼從2014年的AI實驗,變成換臉假影片和百萬美元詐騙?一篇看懂深偽科技離奇又快速的進化史。
一名香港的財務人員,坐下來跟老闆開視訊會議。財務長就在螢幕上,旁邊還有幾位他認得出臉的同事。大家聊了幾句。他們要他轉一筆錢。他照做了——一天之內,十五筆匯款,總共2,500萬美元。
那場會議上的每一個人,都是假的。
沒有一個是真人。那些臉。那些聲音。那些細微的點頭和停頓。全都是電腦吐出來的。他過了好幾天才聞到不對勁——當他打電話回總部,才知道那場會議根本從沒發生過(CNN, 2024)。
那麼,我們是怎麼走到這一步的?一台機器,是怎麼學會戴上一張人臉的?這個故事比你想的還要短。而且離奇得多。

一切,從一張嘴開始
「深偽」這個詞聽起來很新。但它背後的把戲,一點都不新。
把時間倒回1997年。三位研究人員做出一個叫「影片重寫」(Video Rewrite)的程式。餵給它某人說話的舊影片,它就會把那人的嘴巴剪開、重新縫合——直到螢幕上的人,看起來像在說一些他根本沒說過的話。活生生地,當著你的面。當初的目的很單純:把電影配音成別國語言。它做得很粗糙。但它是第一台能完整自動操控人臉的機器,把人變成一隻會說話的木偶(History of Information)。
接下來好幾年,幾乎什麼都沒發生。這項技術只是慢慢爬。
然後,它突然開始狂奔。

兩台機器,死磕到底
2014年6月。 一位名叫伊恩·古德費洛(Ian Goodfellow)的研究員,和他的同事們,揭曉了一個叫「生成對抗網路」——也就是GAN——的東西(Wikipedia)。這裡請放慢一點,因為接下來發生的一切,引擎就是它。
想像兩個電腦程式,被鎖在一場決鬥裡。一個是偽造者,負責畫出假的臉。另一個是偵探,唯一的工作就是揪出哪張是假的。每次偵探抓到一張,偽造者就研究自己哪裡露了餡,學起來,畫出更逼真的一張。然後再來一輪。再一輪。上千輪(MIT Sloan)。
偽造者變得強到讓人發毛——因為那個偵探,永遠不會停止追殺它。從另一端跑出來的,是一張你敢發誓就是真人的臉。
名字,來自最黑暗的角落
「深偽」(deepfake)這個真正的詞,出現在2017年11月。而它,是從整個網路最不堪的角落爬出來的。
一個Reddit用戶——帳號就叫「deepfakes」——開始把名人的臉,貼進色情影片裡。「深度學習」(deep learning)加上「假的」(fake)。這名字就這麼定了下來。一整個社群迅速膨脹,逼近九萬名成員,直到Reddit在2018年2月把插頭拔掉(Reality Defender;The Verge)。
封禁什麼也沒改變。那些工具,早就流到外面的世界去了。
從地下室,到銀行金庫
接下來,它不再只是個讓人毛骨悚然的興趣——它開始真的偷走大筆鈔票。
2019年。 犯罪集團複製了一間公司高層的聲音——那一絲淡淡的德國口音、他說話的節奏、每一個習慣的小細節。然後他們打電話給一家英國能源公司的員工。那名員工確信自己正在跟老闆通話。不到一個小時,22萬歐元(約24.3萬美元)就不見了(Trend Micro)。
五年後:就是你在開頭讀到的,那場2,500萬美元的香港視訊搶劫。
看出規律了嗎?每跨一步,假東西就變得更便宜。更快。更難抓。而這條線,至今還在往上爬。
我們還分得出真假嗎?
這裡有個沒人破解得了的問題:我們能不能可靠地分辨真假——而且,我們有一天做得到嗎?
你大概會覺得答案很簡單。做個假影片偵測器不就好了?我們做了。但它撐不住。
還記得那場決鬥嗎——偽造者對上偵探?問題就出在這裡。GAN天生就是為了打敗偵測器而存在的。你教會一台機器去抓深偽,等於把一張「下次要修哪裡」的清單,親手交到造假者手上。貓抓老鼠,只不過這隻老鼠愈來愈聰明(Optica)。
而且這場洪水還在上漲。到了2024年下半年,大型國家級銀行平均一天被攻擊超過五次——而同一年年初,這個數字還不到一天兩次(SecurityWeek)。2024年那些追著問題跑的研究人員,也坦承了最痛的一點:只要遇到一種全新、從沒見過的假貨,偵測技術當場就崩潰(arXiv, 2024)。
所以,誠實的答案是?我們手上,沒有一套可靠、又能撐到未來的方法去揪出深偽。此時此刻,造假的那一方,正在贏。
那麼,這會走向哪裡?
關於接下來會發生什麼,有三個大膽的猜測。而它們,真的就只是猜測——這些是詮釋和預測,不是已成定局的事實。
也許,偵探會追上來。 有些專家把賭注押在更聰明的AI偵測器,加上「數位浮水印」——在真實影片被拍下的那一瞬間,就烙進一個看不見的標記。這或許能把局勢扳回來。但前提是,地球上每一家攝影機製造商,都同意採用同一套系統。離成真,還差得遠。
也許,我們會不再問「這是假的嗎?」 另一些人認為,我們會把問題整個翻過來:不再問「這影片是假的嗎?」而是問「這影片,能不能證明它是從哪裡來的?」就像藥罐上那層防拆封的封膜。這技術已經存在了。只是離普及,還早得很。
又或者,真正的危險不是機器——而是我們自己。 這一個,最扎心。就像一群研究人員說的,威脅「並非來自用來製造假象的技術,而是來自人天生就傾向於相信自己親眼所見」(UNESCO)。而這還有個惡毒的反面,叫做「騙子的紅利」(liar's dividend):一旦所有人都知道假影片的存在,任何被真實攝影機拍到的人,都可以聳聳肩說一句「那是深偽啦」。這是一種說法,不是經過量測的事實。但它很難甩得掉。
接下來,是那些天馬行空的東西。你會看到有人信誓旦旦地發文,說某些著名事件、登月、或是世界領袖,全部都是偷偷做出來的深偽——又或者,有某個藏在暗處的組織,多年來一直在把真人掉包。這些說法,全都沒有任何可信的證據。 把它們歸進網路鄉野傳說那一類:未經查證,而且幾乎可以肯定是假的。
資料來源與延伸閱讀
- CNN — 財務人員與深偽財務長視訊後,付出2,500萬美元(2024)
- History of Information — 影片重寫,深偽的起源(1997)
- Wikipedia — 生成對抗網路(GAN)
- MIT Sloan — 深偽,講白話
- Reality Defender — 深偽簡史
- The Verge — Reddit封禁深偽換臉色情社群(2018)
- Trend Micro — 罕見的CEO詐騙:深偽語音盜走24.3萬美元(2019)
- SecurityWeek — AI軍備競賽:深偽的生成 vs. 偵測
- Optica — 生成與偵測深偽:一場21世紀的軍備競賽(2025)
- arXiv — 穩健的深偽偵測,需要的不只是視覺鑑識(2024)
- UNESCO — 深偽與認知的危機
深偽,最初是兩台機器之間的一場決鬥——一台說謊,一台想揭穿謊言。但同樣的這個把戲,兩個AI鎖在一場較量裡,如今正在教電腦一件比「偽造一張臉」更離奇得多的事。有些研究人員認為,它正在教電腦學會想要某些東西。當一個AI不再只是複製我們——而是開始替自己做決定,會發生什麼事?
ELIZA(1966):史上第一個聊天機器人,以及我們為何至今仍相信一台聽不懂人話的AI
1966年,麻省理工一支簡單的程式ELIZA,竟讓親手寫它的人的祕書要求單獨相處。ELIZA效應,解釋了我們今天為何仍會信任聊天機器人、AI有意識的說法,還有AI伴侶。
Loab:那個 AI 怎麼刪都刪不掉、不停畫出來的『鬧鬼』女人
一個雙眼空洞的女人,不斷從 AI 生圖工具裡爬出來,沒人刪得掉她。深入 Loab——這個誕生於負面提示詞與潛在空間的病毒級詛咒影像。
AlphaZero 的「外星」棋路:連特級大師都不敢走的那一步
AlphaZero 只花幾小時自學西洋棋,就用怪到沒人懂的棄子,把地表最強引擎打到崩潰。它下棋的方式不像人、也不像機器——這個謎,連棋王到現在都答不全。