谷歌的ai只能用來打星際2？遊戲ai和現實經濟執行相關的個人思考。

2021-03-31遊戲

之前谷歌的遊戲ai——alphastar完勝星際爭霸2頂級選手serral，讓我思考遊戲ai在現實經濟執行的啟示。

之前谷歌的aiAlpha狗已經在圍棋領域超越人類，而最近谷歌deepmind的星際爭霸遊戲ai—Alpha狗的兄弟alphastar又取得新突破，它不僅在遊戲中超越99.85%的玩家，還以4：1戰勝最強人類選手serral，雖然只是一場測試表演賽，但我們可以從中看出一些東西。

【星際爭霸2】的復雜度給AI帶來了巨大的挑戰。和象棋不同，【星際爭霸2】中雙方的軍隊有上百個單位，這些「棋子」會同時、即時地移動，而不是一來一往的回合制。象棋的棋子只有有限的移動方式，而AlphaStar在任何時刻都有10^26種可以選擇的行動。此外，因為「戰爭迷霧」的存在，【星際爭霸2】是一種不完全資訊的遊戲——玩家通常看不到對手在做什麽，因此就無法預測下一步。個人認為，這更接近於現代人類戰爭的情況，或許未來ai會成為真正的戰爭指揮官，給出最正確的決策。（當然，也可能被流浪地球中吳京那樣的人違背）

目前的遊戲ai還不夠成熟，在對陣serral的比賽中，盡管操作能力已經被限制（有效操作epm≤180，相當於頂尖人類選手的水平），但alphastar主要還是靠強大營運能力取勝，即透過強大運算後的最高效率的擴大經濟和出兵能力，這是人類無法做到的。在戰術和戰略選擇上，alphastar並不比頂尖人類選手強，這是遊戲ai必須突破的，因為ai的潛力不在於其計算能力，而在於其學習能力。

DeepMind的AI背後的機器學習原理依賴於人工神經網絡。它能從大規模數據集中辨識出模式，而不僅僅是依賴具體的指示。怎樣在學習人類的思維模式後做出最佳選擇，這是遊戲ai最應該突破的問題。

Deepmind目前關於alphastar的成果已經發表在nature上，最終結果有力證明：通用學習技術可以擴充套件至AI系統，使其能夠在涉及多角色的復雜動態環境中工作。用於開發AlphaStar的技術也有助於進一步提高AI系統的安全性和穩健性，並且很可能推進在現實世界中的其他領域的新研究。比如，alphastar對於經濟效率的運算可能和人類有不同的理解，在星際爭霸二中，單礦最佳開采農民的效率是16個，這是暴雪官方給出的答案，但alphastar會出更多的農民，使得自己的經濟狀況比人類選手更好，但出兵速度並不會像想象中慢那麽多，這是計算的功勞，這打破了之前人類對於遊戲營運的理解，或許未來ai會打破人類對於經濟執行的理解。

頂級星際選手和ai的對戰的結果有力證明：通用學習技術可以擴充套件至AI系統，使其能夠在涉及多角色的復雜動態環境中工作。用於開發AlphaStar的技術也有助於進一步提高AI系統的安全性和穩健性，並且很可能推進在現實世界中的其他領域的新研究，例如產業經濟。