之前谷歌的游戏ai——alphastar完胜星际争霸2顶级选手serral,让我思考游戏ai在现实经济运行的启示。
之前谷歌的ai阿尔法狗已经在围棋领域超越人类,而最近谷歌deepmind的星际争霸游戏ai—阿尔法狗的兄弟alphastar又取得新突破,它不仅在游戏中超越99.85%的玩家,还以4:1战胜最强人类选手serral,虽然只是一场测试表演赛,但我们可以从中看出一些东西。
【星际争霸2】的复杂度给AI带来了巨大的挑战。和象棋不同,【星际争霸2】中双方的军队有上百个单位,这些「棋子」会同时、实时地移动,而不是一来一往的回合制。象棋的棋子只有有限的移动方式,而AlphaStar在任何时刻都有10^26种可以选择的行动。此外,因为「战争迷雾」的存在,【星际争霸2】是一种不完全信息的游戏——玩家通常看不到对手在做什么,因此就无法预测下一步。个人认为,这更接近于现代人类战争的情况,或许未来ai会成为真正的战争指挥官,给出最正确的决策。(当然,也可能被流浪地球中吴京那样的人违背)
目前的游戏ai还不够成熟,在对阵serral的比赛中,尽管操作能力已经被限制(有效操作epm≤180,相当于顶尖人类选手的水平),但alphastar主要还是靠强大运营能力取胜,即通过强大运算后的最高效率的扩大经济和出兵能力,这是人类无法做到的。在战术和战略选择上,alphastar并不比顶尖人类选手强,这是游戏ai必须突破的,因为ai的潜力不在于其计算能力,而在于其学习能力。
DeepMind的AI背后的机器学习原理依赖于人工神经网络。它能从大规模数据集中识别出模式,而不仅仅是依赖具体的指示。怎样在学习人类的思维模式后做出最佳选择,这是游戏ai最应该突破的问题。
Deepmind目前关于alphastar的成果已经发表在nature上,最终结果有力证明:通用学习技术可以扩展至AI系统,使其能够在涉及多角色的复杂动态环境中工作。用于开发AlphaStar的技术也有助于进一步提高AI系统的安全性和稳健性,并且很可能推进在现实世界中的其他领域的新研究。比如,alphastar对于经济效率的运算可能和人类有不同的理解,在星际争霸二中,单矿最佳开采农民的效率是16个,这是暴雪官方给出的答案,但alphastar会出更多的农民,使得自己的经济状况比人类选手更好,但出兵速度并不会像想象中慢那么多,这是计算的功劳,这打破了之前人类对于游戏运营的理解,或许未来ai会打破人类对于经济运行的理解。
顶级星际选手和ai的对战的结果有力证明:通用学习技术可以扩展至AI系统,使其能够在涉及多角色的复杂动态环境中工作。用于开发AlphaStar的技术也有助于进一步提高AI系统的安全性和稳健性,并且很可能推进在现实世界中的其他领域的新研究,例如产业经济。