AI奇聞異事

AlphaZero 的「外星」棋路：連特級大師都不敢走的那一步

作者： The Unsolved Report Editorial Team · 發表於 2019-01-14

AlphaZero 只花幾小時自學西洋棋，就用怪到沒人懂的棄子，把地表最強引擎打到崩潰。它下棋的方式不像人、也不像機器——這個謎，連棋王到現在都答不全。

想像一下：地表最聰明的西洋棋機器，正坐在你對面。它讀過人類有史以來的每一盤棋，一秒能算上百萬種局面。然後，一個陌生人坐了下來——一個幾小時前才「學會」這遊戲、只懂規則的程式——它把一枚棋子塞進棋盤角落，理由沒有任何人類看得懂。

然後它贏了。一次又一次。而且，它從來沒輸過。

那個陌生人，叫 AlphaZero。而棋界的反應不是驕傲，比較接近——恐懼。

8x8x8 Kieseritzky Cubic Chess board, 1851. Done in MSPAINT. Level notation Greek alpha thru theta. — Wikimedia Commons, Ihardlythinkso (CC0)

有憑有據的事實

2017 年 12 月，AI 實驗室 DeepMind 揭曉了一個叫 AlphaZero 的程式。設定離譜到難以置信：它只拿到西洋棋的規則，其他什麼都沒有——沒有開局棋譜、沒有名局、沒有人類教學。它全靠自己跟自己對弈，一遍又一遍，下了上百萬盤，硬是把這遊戲學了起來。

大約四小時的自我對弈之後，AlphaZero 已經強到足以挑戰 Stockfish 8——當時電腦西洋棋界的衛冕冠軍。在一場 100 局的對決裡，AlphaZero 贏了 28 局、和 72 局，輸 0 局（Chess.com）。面對人類打造過最強的引擎，它一盤都沒輸。

完整的方法後來發表在同儕審查的權威期刊《科學》（Science）上，DeepMind 團隊形容這是「一套通用的強化學習演算法，靠自我對弈精通了西洋棋、將棋與圍棋」（Science, 2018）。同一個程式，原封不動，還征服了將棋（日本象棋）和古老的圍棋。

但分數不是最詭異的地方。最詭異的，是它的「棋風」。

DeepMind 共同創辦人 Demis Hassabis 講得很直白：「它下棋不像人，也不像程式。它用的是第三種、近乎外星的方式。」（MIT Technology Review）他特別提到一個瞬間：AlphaZero 把皇后硬塞進棋盤角落——「一個非常怪異、卻帶來驚人局面價值的招數」。他把整件事稱為「來自另一個維度的西洋棋」。

AlphaZero 超愛送子。它會棄掉主教，有時甚至棄掉皇后——棋盤上最強的那枚棋——而且不是失手，是故意的。它拿純粹的子力去換一種優勢，那種優勢微妙到，人類往往要等很多步之後才看懂，甚至根本看不懂。

特級大師 Peter Heine Nielsen 帶過好幾位世界冠軍，他向 BBC 道出了那種感受：「我一直在想，如果有個更高等的物種降落地球，示範他們怎麼下西洋棋，會是什麼樣子。」接著他補上那句令人發毛的話：「現在我知道了。」（ScienceAlert）

真正懸而未決的問題

這裡有個到現在都沒被徹底解開的謎：*沒有人能清楚說明，AlphaZero 那些怪招為什麼會成立。*

像 Stockfish 這種傳統引擎，再強，它也是用人類跟得上的數字在思考。它數子力、它幫局面打分。你可以問它「為什麼走這步？」然後一路追著那串算式看下去。

AlphaZero 不一樣。它在一張神經網路裡，養出了某種「直覺」——那是上百萬個被微調過的數值糾纏在一起，連它的創造者都沒辦法像讀一句話那樣讀懂。它「知道」那步角落皇后很漂亮，就像你「知道」一張臉很友善：瞬間就知道，卻說不出推理是怎麼來的。

這就是科學家口中的認知不透明性（epistemic opacity）——一個 AI 可以穩定地給出正確答案，卻完全沒辦法把過程攤開來給你看，這件事令人不安（ResearchGate）。AlphaZero 發現了人類從沒寫下來過的棋理。但它沒辦法用語言教給我們。我們只能看、只能模仿、只能納悶。

所以真正的謎，不是「AI 作弊了嗎？」它沒有。真正的謎是：它到底懂了什麼，是我們不懂的？

各種說法與解讀

人們給出的答案天差地遠。有些很扎實，有些很離譜。我們一個一個來，誠實面對。

說法一——它只是算得更深（主流觀點）。 很多專家認為，根本沒有什麼魔法。AlphaZero 那些「外星」招數之所以看起來像外星，只是因為回報落在 15 步、20 步之後——遠超出頂尖人類能算到的視野。對 AlphaZero 來說，角落皇后那一步單純就是正確的。合理、也被廣泛接受，但它沒辦法完整解釋那張網路看起來在用的、近乎人類的直覺。

說法二——這場比賽對它有利、不公平（一個站得住腳的批評）。 這點是真的，不是邊緣論。特級大師 Hikaru Nakamura 直指 2017 年那場對決「不誠實」，他主張 Stockfish 被綁手綁腳——被迫在沒有平常開局棋譜的情況下作戰，硬體條件也被一些人認為不利（Chess.com）。這是一場關於測試條件、有憑有據又合理的爭議——不過後來在更公平設定下的重賽，AlphaZero 依舊表現得極為亮眼。

說法三——「也許是我們對西洋棋的想像太小了」（哲學式、推測性的）。 Hassabis 拋出了一個溫和卻燒腦的提議：也許是人類自己把西洋棋框住了——而 AlphaZero 找到了我們從沒注意到的那些門（MIT Technology Review）。角度很有意思，但這是解讀，不是證明。

說法四——它在「思考」、甚至有意識（未經證實，幾乎可以確定是錯的）。 因為 Nielsen 那句「更高等的物種」傳得太廣，網路上有一小撮人現在把 AlphaZero 當成一瞥有意識、外星般機器智慧的證據——甚至開始竊竊私語說 AI 有了感知能力。這件事完全沒有任何證據。 AlphaZero 沒有自我意識、沒有目標、沒有內心世界。它是一台模式比對機器，只是把一個封閉的遊戲玩到了令人瞠目結舌的程度。「外星」這個標籤，是在形容它的棋風，不是在主張那裡面有一顆心智。把這點講清楚：未經證實的臆測，已經逼近神話。

資料來源與延伸閱讀

AlphaZero 讓我們看見一台機器，能在棋盤那整整齊齊的 64 格之內，聰明到無法解釋。但西洋棋有規則。真實世界沒有。那麼，當我們把同一種沉默又外星的直覺，交給某個比遊戲混亂得多的東西時——一張臉、一段聲音、一張根本不存在的照片——又會發生什麼事？

故事，就是從這裡開始變得詭異的。

還沒看夠？下一個謎在這裡

AlphaZero 的「外星」棋路：連特級大師都不敢走的那一步

有憑有據的事實

真正懸而未決的問題

各種說法與解讀

資料來源與延伸閱讀

Google DeepDream：早期 AI 為什麼把狗和眼睛塞滿整個畫面？

深偽的離奇進化史：從實驗室小把戲，到一場2,500萬美元的搶劫

ELIZA（1966）：史上第一個聊天機器人，以及我們為何至今仍相信一台聽不懂人話的AI