Unsolved Report
AI奇闻异事

AlphaZero 的“外星”棋路:人类大师不敢走的那一步,它一走再走

AlphaZero 只用几小时自学国际象棋,然后用一连串匪夷所思的弃子,把地球最强引擎打得抬不起头。为什么它下得既不像人、也不像机器?这是棋坛大师至今说不清的谜。

分享WeiboQQ

想象一下,地球上最聪明的国际象棋机器,正坐在棋盘对面。它读过有史以来记录在案的每一盘棋,每秒能算上百万个局面。这时,一个陌生人坐了下来——它几小时前才刚学会这游戏,只知道规则,别的什么都不会。然后,它把一枚棋子推进了棋盘角落,理由没有一个人类看得懂。

接着,它赢了。又赢了。一遍又一遍。从不输棋。

那个陌生人,就是 AlphaZero。而棋界的反应,不是骄傲,更接近——恐惧。

8x8x8 Kieseritzky Cubic Chess board, 1851. Done in MSPAINT. Level notation Greek alpha thru theta.
8x8x8 Kieseritzky Cubic Chess board, 1851. Done in MSPAINT. Level notation Greek alpha thru theta. — Wikimedia Commons, Ihardlythinkso (CC0)

有据可查的事实

2017 年 12 月,人工智能实验室 DeepMind 公布了一个叫 AlphaZero 的程序。它的设定几乎让人不敢相信:除了国际象棋的规则,什么都没给它——没有开局棋谱,没有名局,没有人类指点。它完全靠自己跟自己对弈,一遍遍、上百万次地学。

大约四个小时的自我对弈之后,AlphaZero 就已经强到敢叫板 Stockfish 8——那是当时电脑象棋的卫冕之王。在一场 100 局的对决里,AlphaZero 赢了 28 局,和了 72 局,输了 0 局(Chess.com)。面对人类造出过的最强引擎,它一局都没输。

完整的方法后来发表在经过同行评审的《科学》(Science)杂志上,DeepMind 团队在文中描述了一种“通过自我对弈精通国际象棋、将棋和围棋的通用强化学习算法”(Science, 2018)。同一个程序,一字未改,还征服了将棋(日本象棋)和古老的围棋。

但真正让人脊背发凉的,不是比分。是它的棋风

DeepMind 联合创始人 Demis Hassabis 说得很直白:“它不像人类那样下,也不像程序那样下。它用的是第三种方式,几乎像外星人。”(MIT Technology Review)他特别提到一个瞬间:AlphaZero 把皇后塞进了棋盘角落——“一个非常古怪的招法,却有着出人意料的位置价值。”他把整件事称为“来自另一个维度的象棋”。

AlphaZero 还特别喜欢送子。它会牺牲一个象,有时甚至牺牲皇后——棋盘上最强的子——而且不是失误,是故意的。它拿实打实的子力,去换一种微妙到人类要过好多步才看明白、甚至永远看不明白的优势。

特级大师 Peter Heine Nielsen 曾给多位世界冠军当过教练,他对 BBC 这样总结那种感觉:“我一直在想,如果有个更高等的物种降临地球,给我们演示他们怎么下棋,会是什么样子。”然后他补了一句让人发冷的话:“现在我知道了。”(ScienceAlert

真正悬而未决的问题

谜题在这里,至今没人完全解开:*没人能清楚说明,AlphaZero 那些怪招为什么管用。*

像 Stockfish 这样的传统引擎,再厉害,思路也是人能跟得上的数字。它数子力,给局面打分。你可以问它“为什么走这步?”,然后一路追着算式看下去。

AlphaZero 不一样。它在一个神经网络里养出了某种“直觉”——一团由几百万个调校过的数值缠成的东西,连它的创造者都没法像读句子那样读懂。它“知道”那个皇后入角是妙招,就像你“知道”一张脸是友善的:一瞬间就知道,却说不出到底凭什么。

这就是科学家所说的悬案——认知不透明性(epistemic opacity):一个 AI 可以稳稳地给出正确答案,却没法把过程摊开给你看,这件事本身就让人不安(ResearchGate)。AlphaZero 发现了人类从没写下来的象棋智慧。可它没法用语言教给我们。我们只能看着、学着、然后纳闷。

所以,真正的谜团不是“AI 是不是作弊了?”——它没有。谜团是:它到底懂了什么,是我们不懂的?

各种说法与解读

人们给出的答案五花八门。有的脚踏实地,有的天马行空。我们一个个老实摆出来。

说法一——它只是算得更深(主流观点)。 很多专家相信,这里根本没有什么魔法。AlphaZero 那些“外星”招法之所以看起来像外星人下的,是因为收益要在 15 步、20 步之后才兑现——早就越过了顶尖人类能算到的地平线。对 AlphaZero 来说,皇后入角就是简单地正确。这个说法合理,也被广泛接受,但它没能完全解释那个网络似乎在用的、近乎人类的直觉。

说法二——比赛被做了手脚,偏向它(一个公道的质疑)。 这条是真的,不是边角料。特级大师 Hikaru Nakamura 把 2017 年那场对决称为“不诚实”,理由是 Stockfish 被削弱了——被迫在没有常用开局库的情况下作战,硬件条件也被一些人认为不利(Chess.com)。这是关于测试条件的、有据可查的正当争议——不过后来在更公平设置下的复赛,AlphaZero 依然表现极其出色。

说法三——“也许是我们对象棋的想象太小了”(哲学性、推测性)。 Hassabis 抛出过一个温和却让人脑洞大开的提议:是人类自己把象棋框死了——AlphaZero 找到了我们从没注意到的那些门(MIT Technology Review)。这个框架很有意思,但它是解读,不是证据。

说法四——它在“思考”,或者有意识(未经证实,几乎可以肯定是假的)。 因为 Nielsen 那句“更高等物种”传得太广,互联网的一个角落如今把 AlphaZero 当成了有意识、像外星人一样的机器智能的惊鸿一瞥——甚至开始窃窃私语地谈论“有感知的 AI”。这件事毫无证据。 AlphaZero 没有意识,没有目标,没有内心世界。它是一个模式匹配器,只不过在一个封闭的游戏里好得吓人。“外星”这个标签,是给它棋风打的比方,不是在宣称它有一颗心。把这条说清楚:未经证实的猜测,已经踩到神话的边上。

Advertisement

来源与延伸阅读

AlphaZero 让我们见识了一台机器:在国际象棋那 64 个整整齐齐的格子里,它能聪明到无法被解释。可象棋有规则,真实世界没有。那么,当我们把同样这种沉默的、外星般的直觉,交给一样比游戏混乱得多的东西时,会发生什么——一张脸、一段声音、一张从来就不真实的照片?

故事,正是从这里开始变得诡异。

© 2026 Unsolved Report · 保留一切权利。严禁未经授权复制、抓取、转载或再散布本站原创文字内容,违者必究。
Advertisement
还没看够?下一个谜在这里

谷歌DeepDream:早期AI为什么满眼都是狗和眼睛?

2015年,谷歌的一个神经网络突然开始在云朵、树木和天空里幻视出狗脸和眼球。这是DeepDream的真实故事——史上第一个爆红的AI艺术,以及它留下的那个至今没有答案的谜题。

深度伪造的离奇速成史:从实验室小把戏到2500万美元的惊天劫案

深度伪造怎么从2014年的一次AI实验,变成了换脸视频和百万美元诈骗?这是深度伪造技术那段离奇又飞快的历史,一次讲清楚。

ELIZA(1966):世界第一个聊天机器人,以及我们为何至今仍信任那个根本听不懂我们的AI

1966年,麻省理工一个简单的程序ELIZA,骗得发明者自己的秘书要求和它单独相处。ELIZA效应解释了我们今天为何仍然信任聊天机器人、相信AI有意识、爱上AI伴侣。

分享WeiboQQ
加入讨论
看到我们漏掉的线索?留下你的看法。
Advertisement
分享