当前位置: 华文问答 > 数码

柯洁与 AlphaGo 对战胜算有多少?

2017-05-23数码

这是个老问题。现在比赛真的开始了,我也简单说说我的想法。

原文:人机大战,个人期待+伪预测 - 知乎专栏

(原文的发布时间是开赛前,不是马后炮啊233)

首先,我简单评论一下【新浪】人机大战柯洁专访-柯洁:曾经准备秘密武器 面对阿法狗奋战到死 这篇新浪对柯洁的专访。这篇文章里柯洁的回答都非常好,和之前接受采访时忽高忽低的说话水平相比,进步很大。其中提到了模仿棋的事,柯洁是这样说的:

问:当时因为住院最后一战没上场,还发微博说准备了秘密武器? 柯洁:当时准备对付AlphaGo的是模仿棋,因为没人用过。不过*古哥*肯定测试过,所以我认为模仿棋恐怕也没什么用,真正下的时候我也不一定会用,但网上可以试试。不过黑棋下模仿棋不太合适,天元一子发挥不了作用,属于白白浪费机会。

之前我写过一篇模仿棋的分析模仿棋,对战AlphaGo的最后一招 - 知乎专栏。柯洁证实了之前准备对Master使用的「秘密武器」就是模仿棋。所谓「*古哥*肯定测试过」,也确有其事。就在上个月,纪录片【AlphaGo】首映式,我在现场询问DeepMind首席执行官哈萨比斯,AlphaGo能否对付模仿棋。哈萨比斯的回答是「It should be okay, but we will see.」 我的解读是,AlphaGo团队针对模仿棋曾做过针对性的测试,且没有出纰漏;不过,在没有上战场之前,哈萨比斯也不敢打包票。

即使如此,我还是期待柯洁能够下一盘(执白棋的)模仿棋。和AlphaGo下模仿棋,柯洁可以慢悠悠摇着纸扇,喝着龙井茶,笑看对手出招;否则,以对手的强大,柯洁难免要咬手指、揪头发。毕竟全国人民都看着呢,形象很重要。



(配图来自新浪)

在之前模仿棋那篇文的评论区,有些人把模仿棋理解成耍赖。要知道,职业棋手在正式比赛中罕用模仿棋的原因,不是因为它不道德,而是因为模仿棋在技术上风险较大,容易被对手牵着鼻子走。然而,除非AlphaGo已经成精,她不会对模仿棋有什么针对性的策略,也就谈不上牵着柯洁鼻子走。相对地,模仿者的优势,在人机大战中被成倍放大:一是节约时间;二是能将局面拖入乱战或者后半盘收束,也就是AlphaGo相对不那么强的领域。小结一下,从胜负角度看,模仿棋是柯洁最好的策略之一;从测试AlphaGo的目的看,模仿棋能够检验AlphaGo是否已经成精,强大到无死角的地步。

除了模仿棋,柯洁可能还有其他秘密武器。我猜测「三三」是其中之一。「三三」开局,和布局阶段的直接「点三三」,在过去二十年里,极少出现在职业棋谱上。自吴清源、木谷实掀起「新布局革命」以来,星、小目、三三、目外的占角曾齐头并进数十年。近期的棋谱里,只见星、小目,不见目外、三三。在布局阶段的「点三三」,也被认为是送对手外势的损棋。然而,化名Master的AlphaGo变身「点三三」狂魔;不仅掏空对手的角地,还追着对手的外势攻击,极其凶残。



(右下角带圈一子,就是Master 「点三三」。「三三」是从棋盘两边数起各三条线的点。在对方先占「星位(四四)」的情况下,在「三三」落子,就是「点三三」,即右下角的棋型。)

Master之后,柯洁也开始大量使用点三三这一招。前不久的新奥杯半决赛,柯洁就下了点三三,击败李喆。不过,柯洁也曾在用到点三三的棋局里尝到败绩。除了点三三之外,柯洁还尝试了三三占角开局。这个尝试也很好理解:既然点三三是好棋,那么我就让你没有三三可以点。既然我占星位你点三三不吃亏,那么我先占三三,被你星位肩冲,我的内心毫无波动,甚至还可以脱先。此前与AlphaGo的对局中,人类很少用三三开局。说不定,三三开局就是柯洁的又一个秘密武器。

最后是个人向伪预测。

1. 比分(柯洁在前,AlphaGo在后)。

3:0或2:1,几率<1%; 1:2,几率 10-15%; 0:3,几率 85%-90%.

柯洁赢一盘就是伟大的胜利,足以载入史册。全败是正常结局。总比分获胜。。也许AlphaGo的机箱里真的藏着另一个柯洁呢?

2. 柯洁使用秘密武器的概率:

模仿棋: 40%; 三三开局:30% (已经在第一局使用); 布局阶段点三三: 60% (已经在第一局使用) ; 妖刀、雪崩定式飞刀: 15%.

3. 团战(五人组)胜率:2%。时间太短,至少要五小时基本用时才能发挥相谈棋的优势。五人组的配合可能也不如金龙城杯的三人组合。( 结果:中盘负

4. 联棋:预测 古力+AlphaGo 中盘胜 连笑+AlphaGo。(结果, 连笑中盘胜