人機大戰落幕 阿法狗3:0全勝柯潔落淚

圍棋 柯潔 人工智能 李世石 TechWeb 2017-06-06

TechWeb 5月28日報道 文/卡卡落

昨天阿法狗(AlphaGo)與素有中國圍棋第一人的柯潔進行了最後一場也就是第三局的比賽。根據柯潔本人的要求比賽當中自己執白子,阿法狗執黑子雙方戰至209手時,柯潔投子認輸。自此全球矚目的人機大戰以阿法狗3:0大獲全勝告終,人類目前為止對戰阿法狗除了李世石的五局對戰當中一局因為阿法狗出現故障而導致失利以外,其餘全部獲勝,橫掃了中韓所有圍棋高手,在圍棋領域已經無人可敵了。

柯潔與阿法狗的對戰於本週在烏鎮開始,其中第一場,柯潔執黑子,以相對保守的方式進行了試探,最終以四分之一子的微弱劣勢落敗;第二場柯潔執白,一度將局面引入複雜的拼殺,但不慎失誤,導致中盤投子;第三場也就是最後一場比賽,柯潔執白子,頗有積極進攻的態勢,但正如前面所說,中盤無力迴天,實際上雙方才下了20幾手,聶衛平就斷言黑棋已經贏了。

人機大戰實際上已經被賦予了更多的看點和關注,以往的高手對決往往只有喜歡圍棋和業內人士才會關注,現在阿法狗和柯潔的對戰,不僅是高手對決,也是人機大戰最終決戰,或許更意味著一個時代的開始和結束。因此無論是過程還是結果都引發了全民關注。

人機大戰落幕 阿法狗3:0全勝柯潔落淚

柯潔現場哽咽 棋局一度停滯

柯潔在前兩場落敗的情況下表示沒有睡好,雖然基本上都不認為柯潔能贏得最後的一局比賽,但曾經一度風光的他恐怕還是有些不甘心。下完白126貼之後,柯潔起身離席,隨後在現場的宣傳板後激動灑淚,約20分鐘之後才平復心情重返棋局,堅持下完了比賽。

在比賽的中後階段,也可以看到柯潔的各種小動作,表情有些焦慮。

在賽後的發佈會上,柯潔表示出懊惱自己的失誤,一度說到哽咽。他認為對手是非常完美的,沒有任何缺陷和失誤,而且也沒有任何心態上的波動,對他自己來說看到了與AlphaGo的差距,對自己也是一種鞭策。

DeepMind團隊宣佈,他們將會與柯潔合作,短期內公佈這三盤棋局的覆盤和講解;會公佈阿法狗50盤自我對戰的過程,並每日在官網上更新棋譜。今年晚些時候,DeepMind團隊會發表論文,解釋新版AlphaGo相對於李世石版本的更新和改善。

人機大戰落幕 阿法狗3:0全勝柯潔落淚

阿法狗被授予職業九段稱號

在當年與李世石對戰之後,在賽後的發佈會上,韓國棋院已經給“阿爾法圍棋”頒發名譽九段證書。無獨有偶,在賽後發佈會上,中國圍棋協會向阿法狗頒佈職業九段稱號。

DeepMind團隊首席科學家大衛席爾瓦作為代表接受了中國棋院院長王汝南頒發的證書。

證書上寫到:AlphaGo是人工智能創新史上的里程碑,是中國古老的圍棋藝術與現代高科技結合創造出的舉世矚目之奇妙成果。神遊局內、經緯天地、妙不可言,置身其中,棋藝世界已入化境。對圍棋之道的深度探索給棋屆留下了寶貴財富,並將圍棋文化的影響傳播世界。圍棋未來必定更加精彩。為此特授予AlphaGo圍棋九段稱號——中國圍棋協會。

自此阿法狗成為了第43位中國圍棋九段的獲得者,只不過這次並不是人類獲得此殊榮。

不過這個稱號是否適用於阿法狗就不得而知了,畢竟此前聶衛平曾經半開玩笑半認真的說阿法狗至少有二十段的水平。

人機大戰恐怕在圍棋領域要落下帷幕了,因為目前看阿法狗已經找不到合適的對手了,團隊曾經明確表示過“這也將是AlphaGo最後一次參加圍棋對弈比賽”,畢竟它的本職工作是深度學習。

人機大戰落幕 阿法狗3:0全勝柯潔落淚

李世石:柯潔九段理所當然應該獲得掌聲

李世石與阿法狗的對戰開啟了人機大戰的序幕,也是迄今為止唯一一個戰勝過阿法狗的棋手,當然據報道是因為當時阿法狗出現了一些故障,但無論如何從結果上看,也是唯一一次人類的獲勝了。

他在看過柯潔的對戰之後表示“對柯潔這次比賽的內容我也不滿足,但是我完全能夠理解他,柯潔九段盡力了。”針對第三局對戰,“柯潔九段放下了一切,毅然無悔地尋找機會,搜索著最艱難的狀況,他拿出了自己最大的能力。”

同時李世石還認為,相比一年前和阿法狗對戰的五局相比,柯潔展示出了更高的圍棋技能,雖然輸得有些可惜,但非常不容易。他評價阿法狗如今發揮非常穩定,已經沒有了一年前偶爾出現非常奇怪的下法了,整個場面都在穩穩地掌控局勢,沒有任何失誤不給對手空間。

海外網友是如何評價的

中日韓三國都非常重視圍棋,所以比賽勝負決定之後也引起了海外網友的熱議,其中不乏有趣的評論。

“向輸了一次還能再戰的名人表達敬意。”

“贏的辦法還是有的……拔電源。”

“將棋是9X9,圍棋是19X19,計算機很難贏人類的,這話也就是2、3年前說的吧,這強大的也太快了。”

“幾個月前,日本的圍棋軟件還輸給趙治勳呢”

“人被打敗很正常,人已經不能比車跑得更快了啊。”

評論中多是讚歎和感慨,也有看過棋局的人對柯潔和阿法狗雙方表達出了敬意,的確這三局都是非常高的對決。從谷歌從十多年前就提出了人工智能和深度學習的理念,直到最近兩年開始展示在公眾面前,以更貼近大眾的方式,直觀的給我們帶來了衝擊,也讓人工智能這個詞再一次成為熱點。

人機大戰落幕 阿法狗3:0全勝柯潔落淚

阿法狗在不斷進化

實際上與柯潔對戰的阿法狗並不是與李世石對戰的阿法狗,李世石也在採訪中確認了這一點,他認為下法更加直接明確,不會出現一些莫名其妙的佈局,牢牢掌控了整盤。

當然這不僅僅是人工智能在軟件上的提升,經過一年的時間,它學習到了更高的圍棋技藝。

去年的阿法狗使用了1202個CPU和176個GPU,同時可以有40個搜素線程。新的阿法狗除了算法上的改進之外,也特別強調了谷歌雲和TPU(向量處理單元)等計算資源上的改進的巨大提升作用。谷歌使用的TPU也就是自家開發的Tensor處理器這是一款具有學習能力的可定製處理器。針對人工智能設計,有更高效的利用率。

柯潔接受記者採訪時曾表示,“感覺AlphaGo和去年判若兩人,去年覺得他的棋還很接近人,現在感覺越來越像圍棋上帝。”

360公司人工智能研究院院長顏水成博士也對賽事進行了點評,“今年的AlphaGo雖然名稱未變,但其實力卻已經得到了極大加強,成為了進化版的AlphaGo2.0。”他還表示,前者去年版本採用的是深度學習的算法,而後者是在深度學習算法基礎上,採用了強化學習方法,而且還更加側重,允許機器人從零開始學習,不需要人為提供模型進行訓練。

具體新的阿法狗都有那些變化,團隊會在之後的分析當中進行詳細說明。

人機大戰落幕 阿法狗3:0全勝柯潔落淚

阿法狗的未來

對戰之後DeepMind團隊發佈博客,公佈阿法狗的下一步計劃。這次圍棋峰會將會是最後一次賽事,或許以後都不會有類似的棋局比賽了,不僅僅圍棋。研發團隊將把精力投入到其它重大挑戰中,研發出高級通用算法,為科學家們解決最複雜的問題提供幫助,包括找到新的疾病治療方法、顯著降低能源消耗、發明革命性的新材料等。

除了詳解阿法狗的變化和對戰棋局意圖之外,今年稍晚時候發佈最後一篇學術論文,詳細介紹其在算法效率上所取得的一系列進展,以及應用在其他更全面領域中的可能性。

以下是阿法狗之父Demis Hassabis的博客全文:

僅下了三手棋,我們就能清楚認識到這將是一盤非凡的對弈。

中國圍棋大師,世界排名第一的柯潔九段一改以往風格,以三·3作為開局。這種開局方式十分罕見,其目的是要在開局階段快速搶佔角部實地。這種下法以往很少被圍棋選手所採用,但卻是 AlphaGo 最喜愛的開局。柯潔也將其使用在了自己的對局當中。

柯潔在首局中深思熟慮的這一手棋,正切合了本次中國圍棋峰會的主題——探索圍棋這一古老遊戲的深遠奧祕。在為期 5 天的峰會中,我們有幸見證了這一遊戲的最高水平。

我們始終堅信 A.I.擁有幫助全社會探索新知識的潛能,並讓我們從中受益。而 AlphaGo 則讓我們真切的感受到了這一點。對於圍棋選手來說,AlphaGo更像是獲得靈感的工具,而不僅僅只是對手。通過AlphaGo的啟發,棋手們能夠在這項具有3000年曆史的遊戲中,嘗試全新的思路與策略。

2016 年在首爾戰勝傳奇棋手李世石時,AlphaGo 所弈出的創新著法,給圍棋界帶來了全新的知識。而年初以 Master 身份在網絡上進行的非官方對局,也給包括柯潔在內的許多頂尖棋手帶來了深遠影響。在本週峰會所舉辦的配對賽中,兩位頂尖棋手與 AlphaGo 分別配對,也展示了人類利用 A.I. 在複雜領域中產生全新認知的潛能。

對於AlphaGo而言,本週在圍棋誕生之地與世界頂尖棋手舉行的一系列扣人心絃的比賽,已經是它作為一個競技程序所能企及的巔峰。因此,此次圍棋峰會將是AlphaGo參加的最後一場賽事。

從現在開始,AlphaGo的研發團隊將把精力投入到其它重大挑戰中,研發出高級通用算法,為科學家們解決最複雜的問題提供幫助,包括找到新的疾病治療方法、顯著降低能源消耗、發明革命性的新材料等。如果人工智能能夠在上述領域發現新的知識和策略,那在這些領域的突破將十分可觀。我們已經迫不及待地想看到這一切的發生。

儘管 AlphaGo 將退出競技比賽的舞臺,但這絕不是我們與圍棋界合作的終點。我們非常感激圍棋界在過去幾年中,對我們工作所給予的鼓勵和支持。我們計劃在今年稍晚時候發佈最後一篇學術論文,詳細介紹我們在算法效率上所取得的一系列進展,以及應用在其他更全面領域中的可能性。就像第一篇 AlphaGo 論文一樣,我們希望更多的開發者能夠接過接力棒,利用這些全新的進展開發出屬於自己的強大圍棋程序。

我們也在開發一個教學工具——這也是我們在過去一週中收到最多的需求。這個工具將可以展示 AlphaGo 對圍棋落子位置的分析,幫助大家更好地瞭解這個程序是如何思考的,最終讓職業棋手以及愛好者可以從 AlphaGo 的視角來重新審視圍棋。尤其讓我們感到榮幸的是,柯潔同意成為我們的第一個合作者,和我們一起來分析他與 AlphaGo 的對局。我們很興奮能聽到他的精彩分析,同時也有機會分享 AlphaGo 的自我分析。

在本次圍棋峰會的最後,我們想給全世界棋迷朋友們送上一份禮物。自與李世石的比賽之後,AlphaGo 成為了自己的老師,並完成了百萬次高水準的自我訓練,以不斷提高。我們會公佈 50 盤 AlphaGo 自我慢棋對弈的棋譜,我們相信這些棋譜中,包含了許多全新的思路及策略。

我們利用本週圍棋峰會的機會,已經與一些頂尖職業棋手分享了這些棋譜中的一部分。世界冠軍時越九段是這樣評價的:“這是我前所未見的,就像是我想象中來自遙遠未來的棋局一樣。” 世界冠軍古力九段說:“AlphaGo 的自我對弈令人難以置信,我們能從中學到太多。” 我們希望所有的棋手都能嘗試使用這些棋譜中的一些著法。大家現在可以從這裡看到前 10 張棋譜,我們接下來會每天更新 10 張新的棋譜,直到 50 張棋譜全部分享完畢。

圍棋界對 AlphaGo 給予了積極的評價,職業棋手和業餘圍棋愛好者也對 AlphaGo 給圍棋這一古老遊戲帶來的全新視角表示歡迎,他們對 AlphaGo 的反應讓我們十分感動。我們計劃把這些新發現應用到其他新領域,以解決當前我們正面臨的一些最重要最迫切的科學挑戰。我們希望,AlphaGo 的故事僅僅只是一個開始。

相關推薦

推薦中...