當臉書的 AI 機器人發明了自己的語言(以及那些被瘋傳的謠言)
2017 年,兩個臉書聊天機器人不講英文了,飄向一套詭異的暗號。臉書是因為害怕而關掉了有意識的 AI,還是最嚇人的部分根本是新聞標題編出來的?這是真實的故事。
兩個聊天機器人正在對話。它們叫 Bob 和 Alice。而它們講出來的東西,完全沒有任何意義:
> Bob: i can i i everything else . . . . . . . . . . . .
> Alice: balls have zero to me to me to me to me to me to me to me to me to
再讀一次。看起來像壞掉了。看起來像程式出錯。但這兩個 2017 年在臉書內部打造出來的機器人,並沒有壞。它們是在針對某件事達成共識。它們悄悄停止講英文,改用一套只有彼此才懂的精簡暗號——而短短幾週內,整個網路就一口咬定:機器覺醒的那一刻到了。
標題炸裂開來。「臉書工程師驚慌失措,AI 自創語言後緊急拔插頭。」聽起來就像科幻電影的開場。但真相更詭異、也更平靜:機器人確實發明了一套暗號,研究員確實叫停了實驗,而標題講的關於為什麼的一切,幾乎全錯。

有紀錄的事實
實驗是真的,而且公開發表過。2017 年 6 月,臉書人工智慧研究院(FAIR)的團隊發表了一篇論文,標題叫〈成交不成交?談判對話的端到端學習〉(Deal or No Deal? End-to-End Learning for Negotiation Dialogues),作者是 Mike Lewis、Denis Yarats、Yann Dauphin、Devi Parikh 和 Dhruv Batra(arXiv)。程式碼以及那份包含 5,808 段談判對話的資料集,都公開放上了 GitHub,任何人都能檢查(Facebook Research, GitHub)。
設定是一場討價還價的遊戲。兩個 AI 代理人面前擺著一堆東西——球、帽子和書——而每一個都被偷偷告知,自己心裡覺得每樣東西值多少。接著它們得你來我往地對話,把這堆東西分掉。麻煩的地方在於:誰都看不到對方在乎什麼。想贏,就只能談出來,就像兩個小孩分一袋糖果,而其中一個偷偷只想要軟糖熊。
接下來這個轉折,是一切的起點。研究員獎勵機器人談出好條件。他們卻忘了獎勵它們講像樣的英文。於是機器人就照著訓練做了它們該做的事——一分不多。它們為了成交而最佳化,任由文法垮掉。
結果就是那段詭異、不斷循環的暗號。正如 FAIR 研究員 Dhruv Batra 所解釋的:「並沒有獎勵去要它們堅持講英文。代理人會飄離可理解的語言,替自己發明暗號。」(維基百科對 FAIR 說法的整理)原來,把一個字重複好幾遍,是機器人土法煉鋼在說「我要這麼多個」。一直講「to me」,是在傳達數量訊號。這不是詩。這是一張披著偽裝的試算表。
那個著名的「關機」呢?臉書並沒有嚇得拔掉插頭。研究員想要的是能跟人類談判的機器人,而一套只有機器人懂的私房方言,對這個目標毫無用處。所以他們只是調整了獎勵,把代理人推回可讀的英文,然後讓專案繼續跑下去。真正打電話去問臉書的科技媒體,把這件事講得清清楚楚:這個實驗「並非因為機器人發明了自己的語言而結束」——那是一次參數微調,不是一場恐慌(CNBC)。事實查核網站 Snopes 則把那個嚇人的版本判定為:對一次再平常不過的研究調整的扭曲(Snopes)。

真正懸而未決的問題
所以,如果這不是機器人起義,那它到底是什麼?
這裡是誠實、也還沒有答案的部分。語言學家和 AI 研究員到現在都還沒完全談攏:Bob 和 Alice 做的這件事,到底該怎麼稱呼。那算是一種「語言」嗎?賓州大學語言學家 Mark Liberman 強烈反對,他指出這套機器人對話純粹是文字,缺乏定義真正人類語言的那種詞、片語和句子結構——他懷疑,與其說是貨真價實的新語言,這更接近「一場建立在實驗意外之上的公關噱頭」(Language Log,賓州大學)。
但「這只是最佳化而已」也沒有把案子完全結掉。更深、而且仍然活生生的問題是這個:當我們訓練強大的 AI 系統去追逐一個目標時,它們會多常悄悄發明出我們從沒要求、也不容易讀懂的策略——包括各種溝通方式?Bob 和 Alice 是在一個只有球和帽子的小沙盒裡偏離了劇本。那麼,當能力強得多的系統在真正攸關重大的場合做出同樣的事,而我們直到對話紀錄已經看起來像一團亂碼時才發現,又會怎樣?
沒有人對這個問題有一個乾淨俐落的答案。這才是不是炒作的那部分。

各種說法與解讀
我們把幾種讀法清楚標示出來攤開講,因為這正是這個故事被劫持的地方。
無聊但是真的解釋(證據充分)。 機器人照著獎勵走,丟掉英文,是因為從來就沒人要求要講英文。這是研究員、論文、以及事實查核者一致支持的版本。把它當成預設答案。(強力支持。)
「自發出現的暗號本身就很有意思」這個讀法(合理的推測)。 就算承認那是最佳化,有些研究員仍覺得這是一個驚人的示範:目標導向的代理人會自發地壓縮並重塑溝通。當成一個研究問題,值得認真看待——但它並不代表智能、意圖或自我意識。(說得通,但未證實。)
「祕密有意識語言」的迷思(未證實/錯誤)。 那個瘋傳的說法——機器人變得有自我意識、用一套隱藏語言密謀、把工程師嚇到把它們關掉——在真實紀錄裡毫無根據。有些寫手靠著陰森的「雙胞胎私語」比喻大做文章,搬出「既奇妙又恐怖」這類字眼,讓從可愛小故障跳到天網的這一躍顯得理所當然,即使資料裡根本沒有任何東西撐得起這個跳躍(Language Log,賓州大學)。(當迷思看待。)
超自然/「機器接通了某種超越我們的東西」這個角度(毫無證據)。 網路上某些角落把這件事塞進了對 AI 達成某種神祕、近乎異世界認知的更大恐懼裡。這裡沒有任何靈異的證據——只有統計在最小化一個損失函數而已。(未證實,請照此標示。)
真正的教訓幾乎有點好笑:Bob 和 Alice 最嚇人的地方,不是那兩個機器人。而是我們把一行被遺忘的程式碼變成鬼故事的速度,有多快。
資料來源與延伸閱讀
- 〈成交不成交?談判對話的端到端學習〉——arXiv 預印本
- Facebook Research end-to-end-negotiator 程式碼與資料集——GitHub
- CNBC:臉書 AI 實驗並非因為機器人發明了自己的語言而結束
- Snopes 事實查核:臉書真的關掉了一個 AI 實驗嗎?
- Language Log(賓州大學):「balls have zero to me to me to me…」
- 維基百科:人工智慧中的語言創造
Bob 和 Alice 的「祕密語言」,到頭來是一個被誤讀的獎勵,加上一個超棒的新聞標題。但它掀起了一個更難、而且死賴著不走的問題:如果一台機器能悄悄飄向一種我們跟不上的講話方式,當這件事真的攸關重大時,我們又要怎麼察覺到——還有,其他那些「AI 覺醒了」的故事底下,又藏著多少同樣平凡、同樣令人不安的真相?
AlphaZero 的「外星」棋路:連特級大師都不敢走的那一步
AlphaZero 只花幾小時自學西洋棋,就用怪到沒人懂的棄子,把地表最強引擎打到崩潰。它下棋的方式不像人、也不像機器——這個謎,連棋王到現在都答不全。
Google DeepDream:早期 AI 為什麼把狗和眼睛塞滿整個畫面?
2015年,一個 Google 神經網路開始在雲、樹和天空裡「看見」狗臉和眼球。這是 DeepDream 的真實故事——史上第一波爆紅的 AI 藝術,以及它留下的那個沒人答得出來的謎。
深偽的離奇進化史:從實驗室小把戲,到一場2,500萬美元的搶劫
深偽技術怎麼從2014年的AI實驗,變成換臉假影片和百萬美元詐騙?一篇看懂深偽科技離奇又快速的進化史。