揭秘战胜全人类的这条“狗”|AlphaGo|人工智能|围棋|李世石|柯洁|象棋

人类智商最后高地沦陷! 一条"狗"创造历史

虽然围棋的拥趸或爱好者，和足篮排这样的竞技体育运动不可同日而语。但在北京时间3月9日，这项脑力运动，却吸引了全世界的目光。交战的一方，是近十年来获得世界冠军最多（14个）的李世石九段，棋盘的另一端，则是谷歌旗下DeepMind公司开发的一款围棋人工智能程序，在2015年10月阿尔法围棋以5:0完胜欧洲围棋冠军、职业二段选手樊麾的一款围棋人工智能程序，名曰AlphaGo，因其英文发音，中国网友为他取名为阿尔法“狗”。

结果是“狗”战胜了人！如果说几个月前挑落樊麾的结果，让人倍感意外还又可以理解，毕竟樊麾只是围棋贫瘠地区欧洲的冠军而已，那么面对如今世界排名第四的韩国棋手李世石的胜利，则让所有人大跌眼镜。国际围棋联盟秘书长、职业三段的韩国棋手李夏辰就表示，“第一次听说电脑要挑战顶级棋手李世石时，我非常惊讶。我觉得挑战者一定对顶级棋手有多强毫无概念，但事实上，是我对电脑有多强没有概念。现在，我感到非常激动。”

负责现场大盘讲解的韩国棋手金成龙则在赛后表示，“我还是无法接受，得好好缓一缓”。腾讯CEO马化腾则表示，AlphaGo的胜利给业界带来非常大的震撼，包括腾讯内部人士都非常激动。围棋世界冠军常昊则说，AlphaGo进步速度确实大大超出了包括自己在内绝大多数人的意料，他甚至开始不禁想象电影《终结者》的情景即将变为现实……

所有人都在惊呼，人类智力骄傲真的像是要崩塌了，那个曾经活在科幻电影的世界即将驾临。但人工智能战胜人类的例子，已经不胜枚举，最著名的当属1997年IBM研发的深蓝战胜棋王卡斯帕罗夫的经典一役，但为何这次AlphaGo的胜利却引发了举世震惊呢？既然人工智能分别在20年前和10年前打败了国际象棋和象棋的顶尖职业棋手，今天再下一城，又有何大惊小怪的呢？

原来在围棋领域，一直被认为人工智能还只是业余水准，要想突破人类高手仍然遥遥无期。国际象棋中，平均每回合有35种可能，一盘棋可以有80回合；相比之下，围棋每回合有250种可能，一盘棋可以长达150回合。这一巨大的数目，足以令任何蛮力穷举者望而却步，因此围棋也被看做是人类最后的智力竞技高地。对于可能性接近于极大的围棋，具有不确定性的人类思维，在传统印象中，似乎比具有固定算法的人工智能更有获胜的把握。但这一切，都被AlphaGo颠覆。

这一次，李世石多少也输在了人类思维的不确定性上。开局时，李世石希望出其不意，用反常规的执黑先行来打乱AlphaGo的既定计划，AlphaGo的应对不佳，有些亏损。李世石显然研究了电脑围棋的理论，得出了电脑在布局阶段不太擅长应对新型的推论，棋局的进行证明了这一点。李世石有备而来，不仅仅为了百万奖金，更是为了人类面对人工智能最后的残留。

不过围棋决定胜负的往往是中盘阶段，AlphaGo似乎也“意识”到了自己形势不佳，之后的下法选择得非常强硬，双方早早就展开了接触战。电脑的下法令观战的职业棋手目瞪口呆，几乎招招都是最佳应对。这一过程中李世石抓住AlphaGo用力过猛的一次机会，围住一块大空。AlphaGo在大局上显现的好像不如人类高瞻远瞩。

不过作为人类最大弱点是会受情绪波动的影响，取得优势后，李世石的心态似乎发生了变化，右下角黑棋下得太过保守，白棋左右逢源，黑棋一无所得，此前的优势消失殆尽。各路讲解的职业棋手判断也出现了分歧，不过随着棋局进入官子阶段，大家发现李世石其实败局已定。最终李世石投子认负。人族最后的骄傲，被AlphaGo击落在地。

揭秘AlphaGo:自学成才一个会推理的大脑

5个月前，战胜欧洲顶级棋手的AlphaGo，那时候的水平被中国棋院评价为，强业5水平，即职业的初级入门层次。到如今战胜李世石的一流九段水平。150天时间，AlphaGo进步可谓光速。虽然有不少观战棋手为人类顶级选手的落败找到了诸多理由，譬如没有发挥出实力、第一盘他更多的是在测试对手功力、第二局的争夺当会更加激烈刺激等云云。但正如负责解说的陈盈初段则反问道：焉知今天不是AlphaGo在测试小李？

用另一个评判标准Elo（围棋等级分）来看，可以算出去年年底AlphaGo的棋力是3168，而同期李世石的Elo大约是3532，目前排名第一的是中国棋手柯洁，李世石排在第4位。从这一数据指标来看，AlphaGo这几个月的成长确实非常惊人。舆论猜测：Deepmid应该改进了AlphaGo的神经网络。对樊麾的比赛中，他们使用了3000万个位置作为原始数据，来训练AlphaGo的价值网络；在对李世石的位置中，他们可以使用1亿个位置训练；另外，也投入了更大的运算量。

有关AlphaGo在这几个月的“进化程度”，谷歌官方并没有给出任何确切的介绍。但是有位名叫安德斯-可鲁夫的围棋游戏设计师给出了这样的猜测：深度学习。即机器通过深度神经网络，模拟人脑的机制来判断、学习、决策。AlphaGo首先习得了人类围棋大师3000万步的走法，之后自我博弈3000万局积累胜负经验，从而构成策略网络，给出落子选择；同时，在自我博弈的训练中形成全局观，构成评价网络，给出修正落子选择。如此循环往复的学习进阶，让AlphaGo可以与李世石分庭抗礼。

换言之，李世石昨天面对的不是叫做AlphaGo的计算机，也不是被网友调侃的一条狗，而是一个类人，它有着和人类一样的学习能力，而且学习效率更高、提升的速度远远快过人类。所以，它仅仅用了不到半年时间，就从勉强的职业入门水准飙升至职业最高水准。再给它几个月时间，AlphaGo岂不是要上天吗？

和1997年美国IBM公司的“深蓝”超级计算机不同，阿尔法狗并不是列举穷尽所有的可能，而是通过“经验”推理出最优解。

AlphaGo的学习能力有没有上限呢？显然这个问题，已经超过了人类的智力上限。英国曼彻斯特大学计算机科学教授凯文-柯伦认为，人类没有理由相信技术会有极限，特别是在AlphaGo这样的特定领域。而来自南京大学计算机系的周志华则认为，上限是客观存在的。周志华表示，“强化学习”奏效的关键，是两个模型都不错，而且有足够大的“差异”。当模型性能提升以后，其差异会显著下降，到了一定程度必然会使性能无法继续通过这种机制提升。其上限取决于高质量“有标记”样本的数量。

虽然人工智能的智力水平的顶峰高度依然存疑，但在情绪因素导致的失误方面，人工智能显然是无瑕疵的。AlphaGo的手下败将樊麾在复盘去年十月的那场人机大战时就表示，最大的问题在于人都会犯错，而机器犯错几率比人少得多。这样的现实，随着比赛的推进、时间的推移，人类选手会因为体力的消耗而更增添精神层面的负担。对人类选手来说，他们的形势不管好还是不好，都担心自己犯错，而根据“房间里的大象”原理，你心里想什么或者担心什么，现实世界就越会发生什么。

但如AlphaGo这样人工智能则完全没有这类概念。这就导致了人类选手的尴尬处境：在优势时，不认为自己能把握住优势；在劣势时，又认为自己一定会输。当年击败众多高手的李昌镐，被称为“石佛”，就是因为他心态好，比赛全过程面无表情，让对手感觉不到他的任何波动。但如今，谁能比AlphaGo更“石佛”呢？即使让人类“石佛”李昌镐对上机器“石佛”AlphaGo，一个是面无表情，另一个是连面都见不到，这样的对决，在心理因素层面，就是不对等的。而这样的不对等，又会诱发人类选手使出小聪明，试图戏耍机器，最终结果却是搬起石头砸自己的脚。

国际象棋一代棋王卡斯帕罗夫对此深有体会。他表示，早期的国际象棋程序有盲点以及一些可以利用的弱点，不禁使人想要去利用，而不是去下堂堂正正的棋。自己当年跟深蓝下的时候就忍不住这样做了。国际象棋和围棋，需要强大的专注力。可是如果老想着去骗电脑，自己的专注力就被破坏了，最后反而会骗了自己，下出疑问手。电脑越强大，这些疑问手就越会被惩罚。

面对一个既拥有超强学习能力和无敌定力的机器，似乎不用多久，十个李世石都无法战胜之。

别慌!这场比赛没有输家人类是最后胜利者

AlphaGo首先成就了围棋这项原本冷门的脑力运动。对于围棋这项古老的东方智慧运动而言，它的发展一直拘泥于东亚一隅。尽管这些年，在欧美开始逐渐推广，但大多数欧洲人对于有着数千年历史的围棋依旧陌生，黑白纹枰如同巨大的鸿沟很难引发欧洲人的关注。尽管我们有俄罗斯的迪娜施塔因、法国的樊麾、荷兰的郭娟等拥有职业段位的选手，但从名字上就能看出，不少欧洲的高手都是东亚移民，他们的水准在东亚都难说入流。

但从樊麾输给AlphaGo开始，欧洲各个围棋协会的网站访问量都超过了10倍。一段时间，欧洲一些大学设立的围棋协会和多个国家的围棋机构都收到了众多爱好者加入和学习的申请。曾经的冷门项目，一时间成为了欧洲人眼中的香饽饽。欧洲围棋联盟主席马丁•斯特阿斯尼表示，“这场‘人机大战’可能令欧洲的围棋推广提速5倍。”

而在围棋的发源及壮大的中心——东亚地区，围棋热也再一次掀起。在韩国，进入3月从农心杯到人机大战，围棋的热度几乎覆盖了各个媒体。《东亚日报》也感叹：“进入围棋月的韩国也将因此受益，过去太多年轻人忽略了这项伟大的技艺。”在中国，“人机大战”也引发了众多普通人的关注。这次AlphaGo与李世石的对决，国内15家网站邀请专业棋手和嘉宾对比赛进行直播。无论是社交工具的新闻弹窗还是新闻客户端的头条显耀位置，都是人机大战的内容。恍如隔世，国人对围棋的关注度一夜回到曾经的中日围棋擂台赛。

当然，AlphaGo的缔造者谷歌，是另一个大赢家。全世界范围内媒体的报道和数以亿计眼球的关注，谷歌可以公开计量的投入，貌似不过100万美金的胜者奖金。无论是实实在在的股价还是虚拟的影响力，对于谷歌来说，这都是一次完美的营销。作为AlphaGo的竞争对手，Facebook人工智能组DarkForest的负责人田渊栋博士虽然不无醋意地表示，就谷歌此前发表的论文看，从算法上说，AlphaGo并没有太多新意，一言蔽之，就是将“深度学习+大数据”与“暴力搜索”结合在一起。但在注意力就是金钱的今天，凭此一役，谷歌将自己推上了人工智能领域不折不扣的领导者。

谷歌赢了，普通人也不必慌乱。这毕竟还是一家以“不作恶”视为准绳的公司，不像某些将脏手伸向疾患论坛的巨头，谷歌对于AlphaGo有着更加有益于人类发展的规划。19年前，打败卡斯帕洛夫的深蓝并未真正成为IBM的核心产品。这个在1997年5月完成惊艳亮相的计算机随即在9月宣布退役。而一手创造AlphaGo的Hassabis则表示，AlphaGo同样的算法可以武装到机器人身上，机器能够快速识别出哪些领域具有研究的潜力，从而帮助人类研究者更好地找到研究方向。

曼彻斯特大学的计算机科学教授，IEEE高级会员凯文-柯伦也认同 Hassabis 预计。他认为AlphaGo可以应用在许多领域，包括解决对抗性问题，或者应用到一些能被视作竞赛的、策略起到重大影响的领域，包括商业、战争或金融交易......由于AlphaGo可以处理大量数据，并且能更快地为科学家带来有助于科研突破的深刻洞见，AlphaGo可能推进科研进度，与科学家携手合作，投入有希望产出研究硕果的领域。

鉴于深度学习已经在现实世界取得重大进展，从图像识别、语音识别再到自然语言处理，深度神经网络为这些技术带来新生。因此 Hassabis的上述表态并非痴人说梦，而更具体或短期的应用则是，帮助智能手机识别图像和语音并进行语言翻译，还能让智能手机理解不同语言，这项技术对于Google布局移动互联网具有重要意义，同时也将树立虚拟助理产品的新标杆，换言之，我们可以和Siri说再见了。

人工智能已经在好莱坞存在一段时间了：最初涉及到思考机器的例子是《2001太空漫游》中的计算机HAL。电影中通过HAL拒绝打开分离舱门时说的一句“我很抱歉Dave，恐怕我不能那么做”给出了人类被机器智能取代的前景，从而给人类带来了新的不安全感。2015年的人工智能题材新作《机器姬》，同样是机器人利用与背叛人类的结局。但别忘了，电影里先行不义的，都是让贪婪侵蚀的人类，机器只是受到伤害后采取了报复。所以，人工智能本身并没有绝对的善或恶，一切，都取决于和它朝夕相处的人类。

结语：莫惊慌，该来的总会到来。无论这场比赛的结果如何，人工智能走近生活的趋势都不会改变，围棋桌上的胜利只会是科技的起点，以AlphaGo为例的人工智能，只要用在正途，人类就会是最大的受益者。

欢迎参与投票

您觉得人工智能未来对人类是好是坏？

好事，将给人类带来无穷便利。

坏事，早晚有一天会不受人类控制。

不好说，有生之年不知道能不够享受到。

查看结果

起止时间：2016-03-09 至 2016-03-23

作者：王阻拦