当前位置: 华文问答 > 数码

柯洁和 AlphaGo 的第二盘棋值得关注之处有哪些?

2017-05-25数码

今天柯洁的发挥可以说非常出色,完成了另一种风格的测试。前天我说柯洁虽然看上去最后只输了1/4个子,但全场落后一步找不到拼的机会,AlphaGo发挥出色到可以说为,稳健到让柯洁想玉碎都找不到玉碎的机会。但今天,柯洁找到机会了,虽然最后真的玉碎了(输了一枚劫财)。

第一盘柯洁开局就模仿了AlphaGo喜欢下的下法,然后却导致稍稍落后,再也追不上。今天AlphaGo却反过来模仿了柯洁最近喜欢下的开局,实在是非常有意思。

黑1、3小目配三三的开局,最早流行是在上世纪六十年代末到七十年代初,当时最喜欢下这种布局的代表性棋手是日本的超一流棋手「剃刀」坂田荣男九段和「电子计算机」石田芳夫九段。但当时还是黑贴5.5目的小贴目时代,现在却施行大贴目规则(中国规则黑贴3.75子,日韩规则黑贴6.5目),因为有这两目之差,所以哪怕同一种开局所导致的局势其实也不尽相同。

今年,柯洁开始大量使用这种布局,前天的第一场比赛也用了,而AlphaGo今天也选用了这种开局,是一种极为有趣的现象,好像程序变的多元化了一样。Master元旦出场期间,选用的开局大多简单,来来回回就是少数几种最流行的开局,然后用简明的定式变化和下法进行定型,大局上稍微一控制就明显领先,然后就收兵赢了。这样子让人看不到上限,只觉得很强,但也稍嫌乏味。今天程序用出新布局,很好玩。

下到上图这个情况,黑5、白6各自强挂小目防止守角,是很标准的传统布局大场顺序,黑7、白8又都选用侧小飞这种相对松缓的定式,给人感觉像是日本巅峰时代的常见对局:开局不急不忙,后发制人,流水不争先。到此时,感觉双方都在复古......但是仅仅几个回合后,双方立刻图穷匕见......

右上角AlphaGo选用了自己喜欢下的托角而非常见的小飞,然后双方在局部各种蜻蜓点水的试探,斗智斗勇,哈撒比斯说柯洁局部的下法和AlphaGo判断的一样,顶尖职业中有些人认为这个局部双方的下法属于很有价值的新变化。AlphaGo黑29之后柯洁脱先,然后双方开始在棋盘左下方广阔地带拼命飙车......大规模乱战已成。至此,柯洁的想法应该已经展示的很明显,想测试一下大规模乱战下会怎么样。

后续的变化非常非常的复杂,大家可以看各种顶尖职业的研究后解说。可以说柯洁前半盘的状态非常良好,棋局一度非常混乱,双方形成天下大劫,而柯洁没有立刻引爆,而是多次在各种局部保留,试图大量增加程序的计算量负担。最终柯洁认为做好了准备,引爆了天下劫之后,很多人认为白棋有机会,但是在复杂的劫争过程中第一个出现失误的是柯洁,劫财转换后白棋简单的不行了。

私下有一些朋友问我对比赛的看法时,我都说这次比赛其实像是以比赛的形式进行测试,在有时限有仪式感的正式比赛中,更容易激发运动员突破极限。第一盘棋柯洁想用AlphaGo的常用下法测试,然后下成了第三代计算机围棋程序最擅长的铺地板的阵地战;第二盘柯洁想用乱战的方式,寻找程序在极复杂变化中的bug,理论上这可能是正面找到胜机的唯一机会,因为蒙特卡洛算法的强逻辑缺失是最容易想到的计算机围棋的缺陷,去年李世石赢下一盘,也是找的这种毛病。

AlphaGo今天在乱战中笑到了最后,但并不说明柯洁的策略是错的。不管是以测试为目的,还是以赢下比赛为目的,既然知道AlphaGo如果有弱点,最可能出现在这种局面下,那就应该导向这种局面。那句话怎么说来着?唯一的办法,就是最好的办法。今天,柯洁也确实将局面导向了自己想要的方向。如果平稳的铺地板斗功力,或者大模样斗大局观,在深度神经网络形成的如此良好的棋感+大局观之下,基本都是安乐死。毕竟那种情况电脑不犯错,对于弱逻辑的虚路棋,大量棋局统计出来的结果总是比你一个人能形成的棋感更稳定准确。

总的来说,这是一盘精彩的对局,柯洁发挥很出色,AlphaGo一如既往的稳定和强大,但前半盘不见得下的完美。期待赛后Deepmind公布更多后台数据,让我们看到AlphaGo的判断和选择,相信会给我们更多的启迪。

明后天的比赛,还是前天那句话,期待看到各种姿势的测试。

祝柯洁以及其他棋手们发挥上佳。