當前位置: 華文問答 > 遊戲

谷歌的ai只能用來打星際2?遊戲ai和現實經濟執行相關的個人思考。

2021-03-31遊戲

之前谷歌的遊戲ai——alphastar完勝星際爭霸2頂級選手serral,讓我思考遊戲ai在現實經濟執行的啟示。

之前谷歌的aiAlpha狗已經在圍棋領域超越人類,而最近谷歌deepmind的星際爭霸遊戲ai—Alpha狗的兄弟alphastar又取得新突破,它不僅在遊戲中超越99.85%的玩家,還以4:1戰勝最強人類選手serral,雖然只是一場測試表演賽,但我們可以從中看出一些東西。

【星際爭霸2】的復雜度給AI帶來了巨大的挑戰。和象棋不同,【星際爭霸2】中雙方的軍隊有上百個單位,這些「棋子」會同時、即時地移動,而不是一來一往的回合制。象棋的棋子只有有限的移動方式,而AlphaStar在任何時刻都有10^26種可以選擇的行動。此外,因為「戰爭迷霧」的存在,【星際爭霸2】是一種不完全資訊的遊戲——玩家通常看不到對手在做什麽,因此就無法預測下一步。個人認為,這更接近於現代人類戰爭的情況,或許未來ai會成為真正的戰爭指揮官,給出最正確的決策。(當然,也可能被流浪地球中吳京那樣的人違背)

目前的遊戲ai還不夠成熟,在對陣serral的比賽中,盡管操作能力已經被限制(有效操作epm≤180,相當於頂尖人類選手的水平),但alphastar主要還是靠強大營運能力取勝,即透過強大運算後的最高效率的擴大經濟和出兵能力,這是人類無法做到的。在戰術和戰略選擇上,alphastar並不比頂尖人類選手強,這是遊戲ai必須突破的,因為ai的潛力不在於其計算能力,而在於其學習能力。

DeepMind的AI背後的機器學習原理依賴於人工神經網路。它能從大規模數據集中辨識出模式,而不僅僅是依賴具體的指示。怎樣在學習人類的思維模式後做出最佳選擇,這是遊戲ai最應該突破的問題。

Deepmind目前關於alphastar的成果已經發表在nature上,最終結果有力證明:通用學習技術可以擴充套件至AI系統,使其能夠在涉及多角色的復雜動態環境中工作。用於開發AlphaStar的技術也有助於進一步提高AI系統的安全性和穩健性,並且很可能推進在現實世界中的其他領域的新研究。比如,alphastar對於經濟效率的運算可能和人類有不同的理解,在星際爭霸二中,單礦最佳開采農民的效率是16個,這是暴雪官方給出的答案,但alphastar會出更多的農民,使得自己的經濟狀況比人類選手更好,但出兵速度並不會像想象中慢那麽多,這是計算的功勞,這打破了之前人類對於遊戲營運的理解,或許未來ai會打破人類對於經濟執行的理解。

頂級星際選手和ai的對戰的結果有力證明:通用學習技術可以擴充套件至AI系統,使其能夠在涉及多角色的復雜動態環境中工作。用於開發AlphaStar的技術也有助於進一步提高AI系統的安全性和穩健性,並且很可能推進在現實世界中的其他領域的新研究,例如產業經濟。