DeepMind向星際玩家們下了戰書!你的對手可能是AI,而你毫不知情


DeepMind向星際玩家們下了戰書!你的對手可能是AI,而你毫不知情


大數據文摘出品

歐洲的星際爭霸玩家們即日將有機會和Deepmind AI打場比賽了!

出戰的AI是由DeepMind和暴雪聯合培養的,經過了“特別的訓練方式”,在星際爭霸界 II 早有過赫赫戰績,連續在10場比賽中擊敗了人類職業選手。

其實,在今年年初的那次交鋒總共有11場比賽,只有全球直播現場交手那一次,由於比賽限制了AI的“視覺”能力,MaNa幫人類贏了一場。

另外10場比賽,代表人類出戰的是職業選手TLO和MaNa。兩位選手分別與AlphaStar打了五場。如果說與TLO對戰時AlphaStar還是萌新的話,那麼與MaNa的對戰則完全顯示出了其戰術的老辣。畢竟,兩個比賽才相隔2周,AI 自學成才的能力已經初步顯示了可以超越人類極限的潛力。


DeepMind向星際玩家們下了戰書!你的對手可能是AI,而你毫不知情

AlphaStar VS TLO



那次輸給AI後,不少星際爭霸 II 的人類玩家都躍躍欲試,希望能親自挑戰AI,但只有少數職業玩家有權與AI對抗。

直到今天,星際爭霸官方發推表示,歐洲區星際爭霸 II 的玩家,將有機會在限定時間內與 DeepMind 的Alphastar人工智能對抗。

你的對手可能是隻AI,而你毫不知情

作為正在進行的人工智能研究的一部分,DeepMind 星際爭霸 II 代理商 AlphaStar 的實驗版本很快將在歐洲競爭激烈的平臺上與人類玩家對抗。

在官方“戰書”中,Deepmind表示,如果你希望有機會和DeepMind 與 AlphaStar 打匹配,你可以點擊遊戲內部彈出窗口上的"選擇加入"按鈕進行選擇。 你可以隨時使用1v1 Versus 菜單上的"DeepMind opt-in"按鈕來改變你的選擇。

DeepMind向星際玩家們下了戰書!你的對手可能是AI,而你毫不知情

為了確保測試數據的真實,玩家不會被告知他們正在和阿爾法星人工智能對抗。 因為當玩家知道自己在對抗AI時,他們的反應可能會有所不同。 玩家可能會參與社區中所謂的"奶酪策略",而 AI 可能還沒有準備好。

從本質上講,"奶酪策略"是一種非常規的戰略,旨在讓對手措手不及。 這些遊戲不會被納入AlphaStar的訓練中,系統只能從人類回放和自我對戰中學習。

AlphaStar是如何訓練的?

DeepMind也在今天的博客中描述了AlphaStar的訓練方式。


AlphaStar是由一個深度神經網絡生成的,它接收來自原始遊戲界面的輸入數據,並輸出一系列指令,構成遊戲中的一個動作。更具體地說,神經網絡體系結構將transformer框架運用於模型單元(類似於關係深度強化學習),結合一個深度LSTM核心、一個帶有pointer network的自迴歸策略前端和一個集中的值基線。這種先進的模型將有助於解決機器學習研究中涉及長期序列建模和大輸出空間(如翻譯、語言建模和視覺表示)的許多其他挑戰。


AlphaStar還使用了一種新的多智能體學習算法。該神經網絡最初是通過在Blizzard發佈的匿名人類遊戲中進行監督學習來訓練的。這使得AlphaStar能夠通過模仿學習星際爭霸上玩家所使用的基本微觀和宏觀策略。這個初級智能體在95%的遊戲中擊敗了內置的“精英”AI關卡(相當於人類玩家的黃金級別)。

OMT: 知己知彼,百戰百勝?

最後,其實就在上週,一個由澳大利亞開發人員、機器學習工程師和研究人員組成的團隊——StarAi就基於星際爭霸的人機對抗開發了一個機器學習課程,並且在線免費發佈,只用瀏覽器就能學!不如先去了解一下你的對手,再來試試看勝算有多大呀!

課程鏈接:

https://www.starai.io/course/

相關報道:

https://www.eassyway.com/starcraft-ii-players-can-now-play-against-deepminds-alphastar-ai-for-a-limited-time/

相關推薦

推薦中...