AI围棋未来走向何方

2018-08-09 15:33 来源:凤凰网科技 责任编辑:郝平

从两年前AI棋手击败李世石起,关于AI围棋的话题就没有断过。不少公司利用自有的计算资源开始研究AI围棋,并且带着自家AI围棋参加各种比赛。

今年7月末,“2018腾讯世界人工智能围棋大赛”总决赛在中国棋院举行。在这场比赛中,最终腾讯的AI围棋绝艺拔得头筹,获得40万元人民币奖金,这也是绝艺第三次夺得世界性AI围棋比赛冠军。

群雄逐鹿

这次的比赛共有11支队伍参加,其中4支来自中国,3支来自日本,一支来自比利时,一支来自美国。经过6月份的预选赛,剩下八支队伍进入决赛。经过7月29日的半决赛后,来自中国的绝艺、星阵,美国的ELFOpenGo,日本的AQ成功晋级总决赛。

在从预赛到决赛的比赛过程中,这些AI棋手不按套路出牌的对弈过程和意外情况,让观战的专业棋手也觉得惊讶。

在复赛中,绝艺对阵星阵,由于遇到了一个AI围棋中常见的“征子”bug,导致绝艺在极短的时间内就落败。

在绝艺对AQ的一场比赛中,开局不久绝艺就使用了尖顶招法,这种下法一般作攻击用,在人类资深选手的对弈中,几乎不会一开始就出顶尖,负责解说的九段棋手柯洁称:“这种棋小时候肯定被老师骂俗手。”不过柯洁补充道,AI们动辄开局第五、六手就尖顶,超出了人们长久以来的围棋认知,完全是一场技术革新。

在另一场绝艺对AQ的比赛中,绝艺执黑先落子,AQ则使出了模仿战术:不管绝艺先走到哪里,AQ就以围棋正中央为中心,下到与绝艺对称的点去。直到第147手,绝艺下到唯一的中心点上去,让AQ不能模仿,才结束了这一僵局,之后仅仅过了30手,AQ就落败。

在比赛中,作为解说员的资深棋手也在感叹,AI的的学习能力太强。

有人问曾被AI棋手“虐”到哭的柯洁,这些AI棋手和人类棋手的差距有多大,柯洁表示:“AI们都是太厉害了,以前绝艺在野狐平台下过让二子棋,但因为有贴目,基本相当于让先,人类顶尖高手应该要好一些,但AI发展一日千里,以后随着它的发展,人类估计二子都够呛了。”

高星、古力讲解棋局

在决胜局的解说过程中,解说员四段棋手高星问九段棋手古力是否与AI交过手,古力回答说:“其实和AI学习还满多的,以前还爆冷赢过,当然那是AI刚出来的时候,但人工智能的发展太迅猛了,到后面就望尘莫及了。经常你看到胜利就在眼前,往往觉得还能下得时候,其实很可能已经不行了。经常是两步棋下完,AI的胜率就已经显示99%了,人工智能就是这么不可思议。”

为什么围棋对AI重要

围棋作为一种东方棋类,本来并不应该是西方科技研究者所能关注的领域,为什么能吸引到这么多AI团队深入这一领域?

这要从“深蓝”说起。1996年,IBM开发的国际象棋AI“深蓝”首次挑战国际象棋世界冠军卡斯帕罗夫,但被击败,许多人说AI并不能同人类相提并论。但第二年,经过改进的国际象棋AI“深蓝”再一次挑战卡斯帕罗夫,取得了胜利,在世界引起轰动。

观众正在观看深蓝与棋手对弈

但还有人对此并不担心,因为当时有一种观点是:围棋才是对弈过程最富变化的棋类,AI棋手不可能胜利。在国际象棋中,平均每回合有35种可能,一盘棋可以有80回合;而围棋的每回合有250种可能,一盘棋可以长达150回合。若是用穷举法,恐怕没有谁想进行这么大数量级的穷举,而人类则可以凭借脑中对棋盘的理解来判断棋子的落脚点。

从这时起,在围棋上取得突破成为一些AI研究者们的目标。AI棋手胜过人类,不仅是一个技术上的目标,更是对AI极限的探索。

这一目标在2016年初终于被实现。2016年初,《自然》杂志封面文章报道了谷歌Deepmind研究者开发的新围棋AI。这款名为“阿尔法狗”(AlphaGo)的人工智能在没有任何让子的情况下以5比0完胜职业围棋二段的樊麾,三个月后,阿尔法狗与围棋世界冠军、职业九段棋手李世石进行围棋人机大战,以4比1的总比分获胜,在世界引起轰动。与樊麾、李世石对弈的阿尔法狗结合了数百万人类围棋专家的棋谱,同时用强化学习的方法进行自我训练。

但此后的升级版本即使没有人类专家棋谱也能进行学习。阿尔法狗升级后的版本名为AlphaGoZero,也被称为阿尔法狗元。阿尔法狗元的能力在此前版本的基础上有了质的提升,研究团队不再向其提供人类棋谱进行学习,而是让它在棋盘上随意下棋,进行自我博弈,以自己下过的棋为经验。阿尔法狗元用了2000个TPU、自我训练了40天,到第40天还没有到达其极限。

阿尔法狗元的无师自通直观证明了AI拥有强大的学习能力。这样强大的学习能力的AI棋手,对人类有什么用?

AI围棋走向何方

目前人类段位最高的围棋等级是职业九段,而目前的AI已经击败了这个段位的棋手,并且实现了完全的自我学习。除了解决一些既定bug,再深入发展的空间并不大,所以不少AI棋手都选择了开源、退役,把代码提供给各个行业的人借鉴,退役的棋手包括包括曾经的风云AI——阿尔法狗。

围棋在西方国家并不盛行,而在亚洲国家则还保留了许多受众,有大量职业选手,AI棋手在亚洲则可以成为人类棋手的陪练,甚至于导师。

今年4月,绝艺就进入中国围棋队训练室,成为国家队训练专用AI。但这也不意味着人人都对着电脑训练,其首要使用AI必须到训练室,必要的集体讨论还是要继续进行。

围棋教练俞斌曾对外表示:“绝艺的作用很大,过去我们争论不休,谁也说服不了谁的局部,AI全部给出数字,这个是棋手最需要的。”

链接 绝艺是谁?

在比赛中大放异彩的绝艺来自腾讯AI Lab(腾讯人工智能实验室)团队,绝艺的名字表面看来是形容自家围棋AI技术超群,其实这个名字是来自于唐朝诗人杜牧的诗句——绝艺如君天下少,闲人似我世间无。

在获得此次比赛冠军之前,已经在好两场世界性的AI围棋比赛中夺冠。

绝艺虽是常胜,但也有马失前蹄的时候,其中最著名的一局是与其“兄弟”凤凰狗对弈,以2比1失败告终,输的两场用的是老版本的绝艺,胜的那场用的是当时还不太稳定的新版本。凤凰狗是腾讯微信团队利用闲时的计算资源做成的AI棋手,以阿尔法狗的算法为基础。不过凤凰狗在出道不久后,就开源了代码,正式退役。