AlphaZero 的「外星」棋路:連特級大師都不敢走的那一步
AlphaZero 只花幾小時自學西洋棋,就用怪到沒人懂的棄子,把地表最強引擎打到崩潰。它下棋的方式不像人、也不像機器——這個謎,連棋王到現在都答不全。
想像一下:地表最聰明的西洋棋機器,正坐在你對面。它讀過人類有史以來的每一盤棋,一秒能算上百萬種局面。然後,一個陌生人坐了下來——一個幾小時前才「學會」這遊戲、只懂規則的程式——它把一枚棋子塞進棋盤角落,理由沒有任何人類看得懂。
然後它贏了。一次又一次。而且,它從來沒輸過。
那個陌生人,叫 AlphaZero。而棋界的反應不是驕傲,比較接近——恐懼。

有憑有據的事實
2017 年 12 月,AI 實驗室 DeepMind 揭曉了一個叫 AlphaZero 的程式。設定離譜到難以置信:它只拿到西洋棋的規則,其他什麼都沒有——沒有開局棋譜、沒有名局、沒有人類教學。它全靠自己跟自己對弈,一遍又一遍,下了上百萬盤,硬是把這遊戲學了起來。
大約四小時的自我對弈之後,AlphaZero 已經強到足以挑戰 Stockfish 8——當時電腦西洋棋界的衛冕冠軍。在一場 100 局的對決裡,AlphaZero 贏了 28 局、和 72 局,輸 0 局(Chess.com)。面對人類打造過最強的引擎,它一盤都沒輸。
完整的方法後來發表在同儕審查的權威期刊《科學》(Science)上,DeepMind 團隊形容這是「一套通用的強化學習演算法,靠自我對弈精通了西洋棋、將棋與圍棋」(Science, 2018)。同一個程式,原封不動,還征服了將棋(日本象棋)和古老的圍棋。
但分數不是最詭異的地方。最詭異的,是它的「棋風」。
DeepMind 共同創辦人 Demis Hassabis 講得很直白:「它下棋不像人,也不像程式。它用的是第三種、近乎外星的方式。」(MIT Technology Review)他特別提到一個瞬間:AlphaZero 把皇后硬塞進棋盤角落——「一個非常怪異、卻帶來驚人局面價值的招數」。他把整件事稱為「來自另一個維度的西洋棋」。
AlphaZero 超愛送子。它會棄掉主教,有時甚至棄掉皇后——棋盤上最強的那枚棋——而且不是失手,是故意的。它拿純粹的子力去換一種優勢,那種優勢微妙到,人類往往要等很多步之後才看懂,甚至根本看不懂。
特級大師 Peter Heine Nielsen 帶過好幾位世界冠軍,他向 BBC 道出了那種感受:「我一直在想,如果有個更高等的物種降落地球,示範他們怎麼下西洋棋,會是什麼樣子。」接著他補上那句令人發毛的話:「現在我知道了。」(ScienceAlert)
真正懸而未決的問題
這裡有個到現在都沒被徹底解開的謎:*沒有人能清楚說明,AlphaZero 那些怪招為什麼會成立。*
像 Stockfish 這種傳統引擎,再強,它也是用人類跟得上的數字在思考。它數子力、它幫局面打分。你可以問它「為什麼走這步?」然後一路追著那串算式看下去。
AlphaZero 不一樣。它在一張神經網路裡,養出了某種「直覺」——那是上百萬個被微調過的數值糾纏在一起,連它的創造者都沒辦法像讀一句話那樣讀懂。它「知道」那步角落皇后很漂亮,就像你「知道」一張臉很友善:瞬間就知道,卻說不出推理是怎麼來的。
這就是科學家口中的認知不透明性(epistemic opacity)——一個 AI 可以穩定地給出正確答案,卻完全沒辦法把過程攤開來給你看,這件事令人不安(ResearchGate)。AlphaZero 發現了人類從沒寫下來過的棋理。但它沒辦法用語言教給我們。我們只能看、只能模仿、只能納悶。
所以真正的謎,不是「AI 作弊了嗎?」它沒有。真正的謎是:它到底懂了什麼,是我們不懂的?
各種說法與解讀
人們給出的答案天差地遠。有些很扎實,有些很離譜。我們一個一個來,誠實面對。
說法一——它只是算得更深(主流觀點)。 很多專家認為,根本沒有什麼魔法。AlphaZero 那些「外星」招數之所以看起來像外星,只是因為回報落在 15 步、20 步之後——遠超出頂尖人類能算到的視野。對 AlphaZero 來說,角落皇后那一步單純就是正確的。合理、也被廣泛接受,但它沒辦法完整解釋那張網路看起來在用的、近乎人類的直覺。
說法二——這場比賽對它有利、不公平(一個站得住腳的批評)。 這點是真的,不是邊緣論。特級大師 Hikaru Nakamura 直指 2017 年那場對決「不誠實」,他主張 Stockfish 被綁手綁腳——被迫在沒有平常開局棋譜的情況下作戰,硬體條件也被一些人認為不利(Chess.com)。這是一場關於測試條件、有憑有據又合理的爭議——不過後來在更公平設定下的重賽,AlphaZero 依舊表現得極為亮眼。
說法三——「也許是我們對西洋棋的想像太小了」(哲學式、推測性的)。 Hassabis 拋出了一個溫和卻燒腦的提議:也許是人類自己把西洋棋框住了——而 AlphaZero 找到了我們從沒注意到的那些門(MIT Technology Review)。角度很有意思,但這是解讀,不是證明。
說法四——它在「思考」、甚至有意識(未經證實,幾乎可以確定是錯的)。 因為 Nielsen 那句「更高等的物種」傳得太廣,網路上有一小撮人現在把 AlphaZero 當成一瞥有意識、外星般機器智慧的證據——甚至開始竊竊私語說 AI 有了感知能力。這件事完全沒有任何證據。 AlphaZero 沒有自我意識、沒有目標、沒有內心世界。它是一台模式比對機器,只是把一個封閉的遊戲玩到了令人瞠目結舌的程度。「外星」這個標籤,是在形容它的棋風,不是在主張那裡面有一顆心智。把這點講清楚:未經證實的臆測,已經逼近神話。
資料來源與延伸閱讀
- AlphaZero's "Alien" Chess Shows the Power, and the Peculiarity, of AI — MIT Technology Review
- A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play — Science (2018)
- Google's AlphaZero Destroys Stockfish In 100-Game Match — Chess.com
- It Took 4 Hours For Google's AI To Master Chess — ScienceAlert
- Mastering Chess and Shogi by Self-Play — arXiv preprint (1712.01815)
- Chess, Artificial Intelligence, and Epistemic Opacity — ResearchGate
AlphaZero 讓我們看見一台機器,能在棋盤那整整齊齊的 64 格之內,聰明到無法解釋。但西洋棋有規則。真實世界沒有。那麼,當我們把同一種沉默又外星的直覺,交給某個比遊戲混亂得多的東西時——一張臉、一段聲音、一張根本不存在的照片——又會發生什麼事?
故事,就是從這裡開始變得詭異的。
Google DeepDream:早期 AI 為什麼把狗和眼睛塞滿整個畫面?
2015年,一個 Google 神經網路開始在雲、樹和天空裡「看見」狗臉和眼球。這是 DeepDream 的真實故事——史上第一波爆紅的 AI 藝術,以及它留下的那個沒人答得出來的謎。
深偽的離奇進化史:從實驗室小把戲,到一場2,500萬美元的搶劫
深偽技術怎麼從2014年的AI實驗,變成換臉假影片和百萬美元詐騙?一篇看懂深偽科技離奇又快速的進化史。
ELIZA(1966):史上第一個聊天機器人,以及我們為何至今仍相信一台聽不懂人話的AI
1966年,麻省理工一支簡單的程式ELIZA,竟讓親手寫它的人的祕書要求單獨相處。ELIZA效應,解釋了我們今天為何仍會信任聊天機器人、AI有意識的說法,還有AI伴侶。