當前位置: 華文問答 > 遊戲

好家夥!B站竟然開源了一個Dota2 AI專案:影魔SOLO智能體

2021-08-04遊戲
為什麽 Dota 裏大家喜歡殺影魔?

‍機器之心報道,編輯:小洲、澤南。

Dota 2 的人工智能擊敗人類,是 AI 界的一次裏程碑事件。2019 年 4 月,OpenAI 提出的 AI 智能體「OpenAI Five」擊敗 OG 成為了第一個在電競遊戲中擊敗世界冠軍的 AI 系統。

作為一款 MOBA(多人線上戰術競技)遊戲,Dota 2 不僅人氣很高,還對人工智能,特別是強化學習系統的研究提出了很多挑戰,例如遊戲時間跨度長,資訊不完善及高度復雜,連續的狀態動作空間。所有這些問題,對於功能完善的 AI 系統在真實世界中的套用至關重要。

既然遊戲是訓練 AI 的好環境,那自然就會有不少科技公司前來嘗試,除了 OpenAI 以外,這些年裏我們還看到過很多的遊戲 AI 專案,如 DeepMind 打星際爭霸、騰訊王者榮耀的「絕悟」、快手的鬥地主 AI。

不過兩天前剛剛開源的一個 AI 專案是我們萬萬沒想到的,小破站 Bilibili 竟然開源了一個強化學習訓練的 Dota2 影魔 solo 智能體。

B 站這個專案叫 Last Order Dota2 Solo AI,雖然並非原創性的遊戲 AI 研究,且當前只有 65 個 star 量,但我們還是想感嘆一句:出息了啊!

專案連結:https:// github.com/bilibili/Las tOrder-Dota2

Last Order Dota2 Solo AI

看介紹,該開源庫由 B 站的團隊成員 Terry-Mao、LiuShuai 參考 OpenAI Five 的研究貢獻。

該庫提供一個由強化學習訓練出的 Dota2 影魔 solo 智能體,可以透過自我對戰的訓練方式訓練,從隨機動作開始學習復雜的策略。而玩家也可以透過執行該專案與智能體進行影魔 solo 對戰。

玩過 Dota2 的玩家都知道,影魔 solo 有一定的限制,如不能使用眼淚、魔瓶。所以在和該智能體對戰時也有以下限制:

  • 物品方面不可以出凝魂之露,靈魂之戒,魔瓶,真眼。
  • 不可以吃符,或使用魔瓶吃符。不可以使用塔防。
  • 一局比賽最⻓時限為 10 分鐘,超時將自動殺死重開房間。
  • 遊戲不能暫停。
  • 在專案中,開發成員還詳細介紹了執行該專案的環境需求,看起來並不復雜:需要安裝 python3.8、依賴庫後,在管理員模式執行的 powershell 進入專案根目錄。執行下面命令即可啟動遊戲:

    python .\play_with_human_local.py

    後面根據專案介紹中的流程建立比賽房間就可以與 AI solo。

    在專案最後,開發團隊也列出了專案的參考資料,包括 OpenAI 的 Dota2 AI 研究【Dota 2 with Large Scale Deep Reinforcement Learning】、一個開源專案 DotaService 以及 Valve 開發者社區的 Dota Bot 指令碼,感興趣的讀者可以自行檢視。

    參考連結:https:// arxiv.org/abs/1912.0668 0

    https:// github.com/TimZaman/dot aservice

    https:// developer.valvesoftware.com /wiki/Dota_Bot_Scripting