圍棋之後 谷歌AI為何向《星際爭霸》遊戲宣戰?

圍棋之後 谷歌AI為何向《星際爭霸》遊戲宣戰?

井字棋,跳棋,象棋,圍棋,撲克。人工智能像無情的潮水一樣席捲了每一場比賽。現在,谷歌的DeepMind又在瞄準一款關於宇宙戰爭的多人遊戲“星際爭霸2”。

沒人指望機器人能在短時間內贏得比賽。

但是,萬一機器真的獲勝,那可比贏得圍棋的成就大得多,並不僅僅是因為星際爭霸是是一款專業電子競技,每個月的累計觀看量能達到數百萬小時。

DeepMind和暴雪剛剛發佈了一款工具,使得AI研究人員製造出能夠在銀河戰爭中與人類競爭的機器人。機器人能夠看到和完成所有人類玩家可以做的所有事情,僅此而已。但是他們不會被優待。

DeepMind和暴雪還將從過去65000場的星際爭霸2遊戲中獲取大量數據,這些數據對機器人的開發至關重要,而且還以每月50萬場的速度遞增。

DeepMind一份新的報告,其中包括將星際爭霸的數據提供給學習軟件的早期結果,顯示出機器要完全掌握該遊戲方式還有很長的路要走。但是,谷歌並不是唯一一家對重視星際爭霸的大公司。週一晚些時候,Facebook發佈了星際爭霸65000場人人對戰的原始數據,來幫助機器人開發者。

然而,投入這麼大血本絕不單單是為了樂趣。谷歌表示,它將利用DeepMind的機器學習技術,削減公司數據中心的冷卻費用。掌握星際爭霸可以讓軟件承擔更復雜、更有利可圖的工作。“從科學的角度來看,星際爭霸與現實生活的屬性非常相似,”紐芬蘭紀念大學的教授大衛丘吉爾說。他曾為DeepMind提供有關星際爭霸工具的指導,也曾組織過星際爭霸機器人競賽。“我們正在為現實中使用的技術做一項測試。”

研究人員使用非官方的開源插件,多年來為星際爭霸的原始版本製作了機器人。丘吉爾教授說,到目前為止,這些機器人水平一般,他們主要依靠的是設計師的戰術,來建立自己對遊戲的掌控,而並非機器學習。

向星際爭霸宣戰顯示了谷歌和Facebook的野心,也顯示了當今最智能軟件的侷限性。 星際爭霸是一款即時戰略遊戲,玩家可以在遙遠的銀河系角落指揮一支外星軍隊。雖然這款遊戲看起來不像圍棋或象棋那麼令人望而生畏,但它向人工智能提出了更大的挑戰。在象棋和圍棋中,你可以看到對手的所有動作和棋子,是所謂的完全信息的博弈。而星際爭霸是一款不完全信息博弈的遊戲。你無法看到對手所有的部隊部署或建設項目,這迫使你不得不採用自己所見以及思維模式,來預測他們可能的計劃。除此之外,星際機器人也不能太依賴超人類能力,快速地處理各種可能性。

圍棋棋局中有效位置的數目是1,後面跟著170個零。研究人員估計,想要達到星際爭霸的複雜性,後面需要至少再增加100個零。

“這是一個很大的進步,”研究星際爭霸的DeepMind研究員Oriol Vinyals說。“這款遊戲將要求我們在規劃、記憶以及如何應對不確定性方面進行創新。”

打敗星際爭霸需要做出很多突破。簡單地把當前的機器學習算法指向過去遊戲的新階段,來模仿人類是不夠的。“電腦將需要開發出適合自己長處的遊戲風格,比如在多任務處理方面,”Martin Rooijackers說,他製造了領先的星際爭霸玩家LetaBot。他說:“機器人玩星際爭霸的方式與人類的方式不同。”

畢竟,萊特兄弟並沒有通過模仿鳥來讓機器飛起來。丘吉爾猜測,“星際爭霸”機器人要打敗人類還需要5年時間。

相關推薦

推薦中...