面对谷歌围棋AI 人类最后的智力骄傲崩塌了?

谢锐01-28 15:01

1月28日,围棋圈和人工智能圈都被一条题为《面对谷歌围棋AI,人类最后的智力骄傲崩塌了》的文章刷屏,这篇文章爆出了一条令人无比震惊的消息:Google开发的一款名为“阿尔法围棋”(AlphaGo)的人工智能,在没有任何让子的情况下以5比0完胜欧洲冠军、职业围棋二段樊麾。

这篇文章写道,“1997年,国际象棋AI第一次打败顶尖的人类;2006年,人类最后一次打败顶尖的国际象棋AI。欧美传统里的顶级人类智力试金石,在电脑面前终于一败涂地,应了四十多年前计算机科学家的预言。至少还有东方,人们自我安慰道。围棋AI长期以来举步维艰,顶级AI甚至不能打败稍强的业余选手。这似乎也合情合理:国际象棋中,平均每回合有35种可能,一盘棋可以有80回合;相比之下,围棋每回合有250种可能,一盘棋可以长达150回合。这一巨大的数目,足以令任何蛮力穷举者望而却步——而人类,我们相信,可以凭借某种难以复制的算法跳过蛮力,一眼看到棋盘的本质。”

在2015年11月北京举行的人工智能围棋赛中,获得冠军的电脑软件在与职业七段棋手连笑的让五子局中败下阵来,当时普遍的观点是,人工智能在围棋领域最高水平只是业余4段左右,要想达到职业高手的高度,还有漫长的路要走。

但不曾想,仅仅两个月的时间里,人工智能界就爆出这样一条震撼性的消息来;而且,这还是2015年10月进行的对局,谷歌公司将此消息封锁,直至今日才公布开来。

樊麾生于80年代,在中国打上职业二段后赴法留学,后来成为法国国家围棋队总教练,已经连续三年赢得欧洲围棋冠军的称号。在他对阿尔法围棋5连败的消息公开后,他坦言,虽然从几盘棋谱上AI表现出的水平不是特别惊人,但在当时的局面下正好可以击败他。最令他对局时感到绝望的是,不能出现失误。第二局他的局面本来极好,但由于一个随手被对方抓住,后面竟然就没有了机会。之后他自己的心态发生了变化,而且自己棋上的弱点被AI完全掌握。

阿尔法围棋有多强,这里有一组胜负结果可以参考:研究者让AlphaGo与其他的围棋AI进行较量,在总计495局中只输了一局,胜率是99.8%。它甚至尝试了让四子对阵Crazy Stone、Zen和Pachi三个比较有名的先进的围棋AI,胜率分别是77%、86%和99%,由此可见AlphaGo有多强大。这次阿尔法围棋在与人类职业高手对弈中取得5战全胜的战绩,已经超出了之前所有人工智能在围棋领域的成就。樊麾本人也说:“虽然我的水平不是特别高,但对他5比0的比分就算放在职业棋界,恐怕也没有太多人能绝对做到。”

计算围棋是个极其复杂的问题,比国际象棋要困难得多。围棋最大有3^361 种局面,大致的体量是10^170,而已经观测到的宇宙中,原子的数量才10^80。国际象棋最大只有2^155种局面,称为香农数,大致是10^47。面对任何棋类,一种直观又偷懒的思路是暴力列举所有能赢的方案,这些方案会形成一个树形地图。AI只要根据这个地图下棋就能永远胜利。然而,围棋一盘大约要下150步,每一步有250种可选的下法,所以粗略来说,要是AI用暴力列举所有情况的方式,围棋需要计算250^150种情况,大致是10^360。相对的,国际象棋每盘大约80步,每一步有35种可选下法,所以只要算35^80种情况,大概是10^124。无论如何,枚举所有情况的方法不可行,所以研究者们需要用巧妙的方法来解决问题,他们选择了模仿人类大师的下棋方式。

研究者们祭出了终极杀器——“深度学习”(Deep Learning) 。深度学习是目前人工智能领域中最热门的科目,它能完成笔迹识别,面部识别,驾驶自动汽车,自然语言处理,识别声音,分析生物信息数据等非常复杂的任务。阿尔法围棋的核心是两种不同的深度神经网络。“策略网络”(policy network)和 “值网络”(value network)。它们的任务在于合作“挑选”出那些比较有前途的棋步,抛弃明显的差棋,从而将计算量控制在计算机可以完成的范围里,本质上和人类棋手所做的一样。

人类在下棋时有一个劣势,在长时间比赛后,他们会犯错,但机器不会。而且人类或许一年能玩1000局,但机器一天就能玩100万局。所以AlphaGo只要经过了足够的训练,就能击败所有的人类选手。

在2016年3月,阿尔法围棋将与韩国李世石九段在首尔进行一次对抗赛,奖金由Google提供的100万美金。李世石是最近10年中获得世界冠军头衔最多的棋手(14个)。围棋是最后一个人类顶尖高手能战胜AI的棋类游戏。之前有人预测说,AI需要再花十几年才能战胜人类,所以这场比赛或许会见证历史。

AlphaGo  /   樊麾  /   李世石  /   人工智能  /  

热门评论

暂无评论

全部评论

暂无评论