三村智保談AlphaGo Zero

圍棋 柯潔 李世石 棋牌 找藉口安靜 找藉口安靜 2017-11-03

原址://mimura15.jp/?p=2754

原題:AlphaGoZero登場&棋譜感想

作者:三村智保

日期:2017年10月19日

三村智保談AlphaGo Zero

2017年10月18日,AlphaGo的最新版本被髮表出來了。

據說最新版本沒有給它導入任何棋譜,完全讓電腦從零開始學習圍棋。

在此之前我非常期待DeepMind會開發什麼新的程序,但是因為退役使我打了退堂鼓。

然後它呈現給我們到內容也非常震驚。

論文上說,新版AlphaGo僅用了三天時間,實力就超過了2016年3月戰勝李世石版本的初代AlphaGo。

之後,再第40天的時候,把當時最強的AlphaGo Master擊敗了。

2017年5月,以壓倒性優勢擊敗柯潔九段並宣佈退役的AlphaGo,在此之後依舊在幕後進步程序。

我們可以想象自我進行強化的現實,但是隻教它簡單的規則後讓他自我對局,並且只用了40天就超過了所有人。我對這樣幾乎無法成為現實的事實面前,感到非常驚訝。

我從幾盤被公佈的棋譜裡,選出3盤明顯看到程序成長的棋譜,進行簡單的解說。

第一局

三村智保談AlphaGo Zero

看到第一手的時候以為這是最好的第一手棋,但是看到後面,才知道這個棋譜是AlphaGo Zero剛剛開始自我對局的棋譜。

三村智保談AlphaGo Zero

或許圍棋之神剛開始也是這麼下棋的。

第二局

三村智保談AlphaGo Zero

剛開始都下在了星位,而且還有點三三的下法,這個時候已經有相當的實力了。

第三局

三村智保談AlphaGo Zero

這個時候AlphaGo Zero的棋已經很難判斷有多強了。本以為這已經適最強版本了,但是這只是自我對局剛開始第70小時的時候,或許已經超過了對李世石的版本。

我還看了幾盤吊打Master的棋譜,不過之後每一盤棋的佈局,它們都是從角上開始行棋的。

然後程序的中後盤,和人類棋手所說的“棋理”感覺也沒有差得很離譜。

程序從零起步,僅通過自我學習就發現了擁有長久歷史的定式手順,甚至還演變出了程序原創的定式。

還有一點,雖然沒法確定,但是我們可以知道的是,AlphaGo Zero的計算力非常驚人。

AlphaGo Zero可以把戰勝柯潔九段的AlphaGo完勝,或許計算力的差距吧。

我想在不久的將來,會有很多著名棋手研究AlphaGo Zero,期待他們對它的評價。

我也在看著棋譜的同時,期待棋手們的評價。

相關推薦

推薦中...