AI奇闻异事

AlphaZero 的“外星”棋路：人类大师不敢走的那一步，它一走再走

作者： The Unsolved Report Editorial Team · 发表于 2019-01-14

AlphaZero 只用几小时自学国际象棋，然后用一连串匪夷所思的弃子，把地球最强引擎打得抬不起头。为什么它下得既不像人、也不像机器？这是棋坛大师至今说不清的谜。

想象一下，地球上最聪明的国际象棋机器，正坐在棋盘对面。它读过有史以来记录在案的每一盘棋，每秒能算上百万个局面。这时，一个陌生人坐了下来——它几小时前才刚学会这游戏，只知道规则，别的什么都不会。然后，它把一枚棋子推进了棋盘角落，理由没有一个人类看得懂。

接着，它赢了。又赢了。一遍又一遍。从不输棋。

那个陌生人，就是 AlphaZero。而棋界的反应，不是骄傲，更接近——恐惧。

8x8x8 Kieseritzky Cubic Chess board, 1851. Done in MSPAINT. Level notation Greek alpha thru theta. — Wikimedia Commons, Ihardlythinkso (CC0)

有据可查的事实

2017 年 12 月，人工智能实验室 DeepMind 公布了一个叫 AlphaZero 的程序。它的设定几乎让人不敢相信：除了国际象棋的规则，什么都没给它——没有开局棋谱，没有名局，没有人类指点。它完全靠自己跟自己对弈，一遍遍、上百万次地学。

大约四个小时的自我对弈之后，AlphaZero 就已经强到敢叫板 Stockfish 8——那是当时电脑象棋的卫冕之王。在一场 100 局的对决里，AlphaZero 赢了 28 局，和了 72 局，输了 0 局（Chess.com）。面对人类造出过的最强引擎，它一局都没输。

完整的方法后来发表在经过同行评审的《科学》（Science）杂志上，DeepMind 团队在文中描述了一种“通过自我对弈精通国际象棋、将棋和围棋的通用强化学习算法”（Science, 2018）。同一个程序，一字未改，还征服了将棋（日本象棋）和古老的围棋。

但真正让人脊背发凉的，不是比分。是它的棋风。

DeepMind 联合创始人 Demis Hassabis 说得很直白：“它不像人类那样下，也不像程序那样下。它用的是第三种方式，几乎像外星人。”（MIT Technology Review）他特别提到一个瞬间：AlphaZero 把皇后塞进了棋盘角落——“一个非常古怪的招法，却有着出人意料的位置价值。”他把整件事称为“来自另一个维度的象棋”。

AlphaZero 还特别喜欢送子。它会牺牲一个象，有时甚至牺牲皇后——棋盘上最强的子——而且不是失误，是故意的。它拿实打实的子力，去换一种微妙到人类要过好多步才看明白、甚至永远看不明白的优势。

特级大师 Peter Heine Nielsen 曾给多位世界冠军当过教练，他对 BBC 这样总结那种感觉：“我一直在想，如果有个更高等的物种降临地球，给我们演示他们怎么下棋，会是什么样子。”然后他补了一句让人发冷的话：“现在我知道了。”（ScienceAlert）

真正悬而未决的问题

谜题在这里，至今没人完全解开：*没人能清楚说明，AlphaZero 那些怪招为什么管用。*

像 Stockfish 这样的传统引擎，再厉害，思路也是人能跟得上的数字。它数子力，给局面打分。你可以问它“为什么走这步？”，然后一路追着算式看下去。

AlphaZero 不一样。它在一个神经网络里养出了某种“直觉”——一团由几百万个调校过的数值缠成的东西，连它的创造者都没法像读句子那样读懂。它“知道”那个皇后入角是妙招，就像你“知道”一张脸是友善的：一瞬间就知道，却说不出到底凭什么。

这就是科学家所说的悬案——认知不透明性（epistemic opacity）：一个 AI 可以稳稳地给出正确答案，却没法把过程摊开给你看，这件事本身就让人不安（ResearchGate）。AlphaZero 发现了人类从没写下来的象棋智慧。可它没法用语言教给我们。我们只能看着、学着、然后纳闷。

所以，真正的谜团不是“AI 是不是作弊了？”——它没有。谜团是：它到底懂了什么，是我们不懂的？

各种说法与解读

人们给出的答案五花八门。有的脚踏实地，有的天马行空。我们一个个老实摆出来。

说法一——它只是算得更深（主流观点）。 很多专家相信，这里根本没有什么魔法。AlphaZero 那些“外星”招法之所以看起来像外星人下的，是因为收益要在 15 步、20 步之后才兑现——早就越过了顶尖人类能算到的地平线。对 AlphaZero 来说，皇后入角就是简单地正确。这个说法合理，也被广泛接受，但它没能完全解释那个网络似乎在用的、近乎人类的直觉。

说法二——比赛被做了手脚，偏向它（一个公道的质疑）。 这条是真的，不是边角料。特级大师 Hikaru Nakamura 把 2017 年那场对决称为“不诚实”，理由是 Stockfish 被削弱了——被迫在没有常用开局库的情况下作战，硬件条件也被一些人认为不利（Chess.com）。这是关于测试条件的、有据可查的正当争议——不过后来在更公平设置下的复赛，AlphaZero 依然表现极其出色。

说法三——“也许是我们对象棋的想象太小了”（哲学性、推测性）。 Hassabis 抛出过一个温和却让人脑洞大开的提议：是人类自己把象棋框死了——AlphaZero 找到了我们从没注意到的那些门（MIT Technology Review）。这个框架很有意思，但它是解读，不是证据。

说法四——它在“思考”，或者有意识（未经证实，几乎可以肯定是假的）。 因为 Nielsen 那句“更高等物种”传得太广，互联网的一个角落如今把 AlphaZero 当成了有意识、像外星人一样的机器智能的惊鸿一瞥——甚至开始窃窃私语地谈论“有感知的 AI”。这件事毫无证据。 AlphaZero 没有意识，没有目标，没有内心世界。它是一个模式匹配器，只不过在一个封闭的游戏里好得吓人。“外星”这个标签，是给它棋风打的比方，不是在宣称它有一颗心。把这条说清楚：未经证实的猜测，已经踩到神话的边上。

来源与延伸阅读

AlphaZero 让我们见识了一台机器：在国际象棋那 64 个整整齐齐的格子里，它能聪明到无法被解释。可象棋有规则，真实世界没有。那么，当我们把同样这种沉默的、外星般的直觉，交给一样比游戏混乱得多的东西时，会发生什么——一张脸、一段声音、一张从来就不真实的照片？

故事，正是从这里开始变得诡异。

还没看够？下一个谜在这里

AlphaZero 的“外星”棋路：人类大师不敢走的那一步，它一走再走

有据可查的事实

真正悬而未决的问题

各种说法与解读

来源与延伸阅读

谷歌DeepDream：早期AI为什么满眼都是狗和眼睛？

深度伪造的离奇速成史：从实验室小把戏到2500万美元的惊天劫案

ELIZA（1966）：世界第一个聊天机器人，以及我们为何至今仍信任那个根本听不懂我们的AI