古力:柯潔最近棋風大變 胡耀宇:應當作打遊戲通關

胡耀宇:人機戰柯潔應享受比賽 當打遊戲通關

古力:柯潔最近棋風大變 胡耀宇:應當作打遊戲通關

5月17日,距離第二次圍棋人機大戰打響還有6天時間,人機話題成為近期人們關注的主題,棋手們對此話題也有了不少新的感悟。在這樣的背景下我們對圍棋國手胡耀宇進行了再次專訪,來聽聽他的看法。

新浪:最近一段時間,很多棋手都在下AlphaGo的招法,序盤很早點三三變得越來越常見,似乎正在掀起一場圍棋的技術革命,您如何看待?

胡耀宇:是的,最近很多棋手在嘗試序盤點三三,尤其是柯潔下的最多。而且這些嘗試經過了實戰的檢驗,效果還不錯。但也不是說點三三就一定好。畢竟阿爾法狗還在下星位,如果點三三一定好的話,AlphaGo就不會下星位了。

技術革命還談不上,應該說是新佈局的革命!其實AlphaGo的點三三告訴了我們:“圍棋佈局的思路可以很開闊,下哪裡都可以,好壞利弊是相對的,關鍵不在於點三三是否好,而在於點完三三之後該如何運用。”

所以,想下好圍棋的序盤,不能一味地模仿,而是要去理解其下法背後的利弊,然後在實戰中靈活運用。死記硬背是經不起實戰考驗的。

新浪:柯潔在新奧杯闖進決賽後的採訪中提到,對人工智能的招法有理解,借鑑和模仿,您對這個問題怎麼看?

胡耀宇:柯潔提到的“模仿,借鑑,理解”這三點,其實是一個學習的過程。怪不得柯潔最近老是點三三(笑),可以感覺到柯潔在學習AlphaGo,“想要打敗你的對手,首先要學會尊重你的對手,並向他學習。”看來柯潔是憋著勁兒要打敗AlphaGo。

新浪:從專業棋手的角度講,您給柯潔的建議是什麼?

胡耀宇:這次跟第一次人機大戰情況不同,第一次人機大戰的時候,幾乎所有人賽前都看好李世石,所以李世石壓力巨大。這次幾乎所有人都看好AlphaGo,我想柯潔可以很輕鬆的去迎戰AlphaGo。技術上的問題柯潔肯定想的比我多,所以我就給柯潔提個心理層面的建議:“享受比賽的過程,就當做打電腦遊戲,一心想著怎麼通關就可以了。”

新浪:周睿羊,陳耀燁它們要組隊迎戰AlphaGo,贏的機會有多大?您如何看相談棋?

胡耀宇:我以前經常下相談棋,相談棋的質量好壞取決於團隊的配合和默契,並不是人數多就一定好。我個人覺得最合適的組隊人數應該是三個人,五個人其實多了。而且這次比賽人類棋手團隊只有兩個小時的用時實在是太少了!五個人的話,起碼得五個小時才夠用。可能是因為日程安排的原因,沒法有那麼多時間。雖然比賽的形式和過程一定會非常精彩!但兩個小時的時限,我並不看好人類棋手團隊。

新浪:關於烏鎮人機大戰,您對柯潔,古力和周睿羊他們在勝負之外的期待是什麼?

胡耀宇:首先我很期待勝負本身,勝負是圍棋的魅力之一。勝負之外,我首先期待比賽過程中AlphaGo的招法會帶給我們的思路帶來什麼樣的啟發?其次,我很期待整個比賽結束後的人機合作,AlphaGo的團隊能否公開一些AlphaGo在棋上的想法和思路(參考圖)?讓我們也看看AlphaGo是怎麼思考的,這對我們棋手在技術和圍棋理論上的幫助是巨大的!

最後,我更期待的是:“AlphaGo會給圍棋界帶來什麼不一樣的變化?宏觀一點說:“AlphaGo帶給圍棋界的變化,就是今後人工智能帶給社會各界變化的前哨戰。”所以,這次烏鎮人機大戰不僅是圍棋界應該關心的事情,更是整個社會應該關心的事情!

(張祺)

古力:最近柯潔棋風改變大 想贏AI一盤概率低於10%

古力:柯潔最近棋風大變 胡耀宇:應當作打遊戲通關

來源:西安晚報

備受關注的“人機大戰”第二季將於本月下旬在浙江烏鎮舉行,屆時世界等級分第一人柯潔將與AlphaGo展開人類與電腦的“終極對決”。昨日,前來西安參加圍甲聯賽的8次世界冠軍獲得者古力接受本報專訪時表示,柯潔儘管很強大,但與AlphaGo的對弈勝率很小。

古力:柯潔最近棋風大變 胡耀宇:應當作打遊戲通關

圍棋一直以來被視為人類智慧的聖殿,去年3月,李世石與人工智能AlphaGo展開了一場“捍衛人類智力”的人機大戰,結果李世石1-4落敗。那次對弈前,古力曾是“挺李派”,他堅信人工智能不可能戰勝人類高手,但結果讓古力感到“很不可思議”。

今年年初,“Master”(AlphaGo升級版註冊的對弈ID)橫掃中日韓棋手,60場對弈全部取勝後,古力同樣是反應最為強烈的棋手之一,而現在他說自己已經接受了人類不是人工智能對手的現實。“起初對於人工智能不瞭解,但經過了近一年來的瞭解後,發現想贏它的確很難,即使過去我們覺得人類很強的地方,後來發現也明顯遠遠不如人工智能。”

古力說,去年圍觀李世石與AlphaGo對弈時,大家對於勝負判斷的分歧很大,而即將舉行的柯潔與AlphaGo升級版的對弈,分歧相對小一些。“大家基本上都認為柯潔可能難以戰勝對手,年初Master與我們下棋時取得60連勝,而且那還不是AlphaGo的最強版本,所以柯潔此次想要獲勝比較艱難。不過, Master 那時與我們只下快棋,如今柯潔與對手下的是慢棋,也有說不清的不可預知的因素,所以還是要看柯潔的臨場發揮,他最近的棋風改變也是挺大的,希望他能有好的表現。”

“贏一盤可能性也不到10%”

關於人工智能,古力在微博上與柯潔互動頻繁,他也曾希望柯潔能為人類“挽回顏面”,但此次柯潔與AlphaGo對弈,古力認為柯潔的勝率很小,甚至贏一盤棋的可能性也不到10%。“與柯潔對弈的新版本還沒有出來,它是什麼樣一個對手我們都還不清楚,從 Master 的表現來看,它有些規避戰鬥,但也有可能本身戰鬥很強,只是那60場勝利沒有下出戰鬥的棋,靠大局就把我們贏了。我覺得柯潔與AlphaGo對弈輸贏不重要,只要放下包袱,發揮出自己的水平就行。”

很多人都在好奇,人類棋手與人工智能最大的差距是什麼,對此古力表示,人工智能集所有的棋譜以及一些自主創新的、人類沒有見過的招法。“人類棋手因為佈局階段可能擺得多一點,所以相對更瞭解一些,也就好下一些,但是中後盤的弱點就很明顯。不管是人機大戰第一季還是 Master 來看,人類棋手與人工智能最大的差距就是在中盤以後,且差距會越來越大。就是從50手到150手之間,人類明顯要遜色於人工智能。而且只要你一落後,就沒有取勝的機會。人類跟人類下的話,落後了還能逆轉。人工智能雖然也會犯錯,但它犯錯誤時已經確保勝利了,所以這也是比較可怕的一點。”

“人工智能會改變圍棋規則”

這是人機大戰的第二季,也被視為是終極一戰。此次比賽除了柯潔與AlphaGo的三番棋之外,還有5名世界冠軍的團隊賽以及人機配對賽。如果此次人類再度完敗的話,未來人機大戰還有意義嗎?在古力看來,如果真的完敗了,未來再舉行類似的比賽將沒有任何意義。“不過,人工智能在技術上仍會帶給圍棋改變,通過研究它們的自我對弈,可能會發現另一片天地 ,比如貼目是我們人類自己決定的規則,如果它們通過大量的對局,能給出一個合理的貼目數,圍棋的規則也可能隨之改變。”

古力說,人工智能出現以前,人類曾以為在圍棋領域的高度至少達到了50%,但現在來看人類還處於初級階段。“人工智能比我們更接近圍棋真理,但也還存在一定差距。我認為,人工智能要想達到完美也是幾乎不可能的。它的無懈可擊,只是相對於人類而言。”

陳經:柯潔應決勝前半盤 戰AlphaGo要有自信

古力:柯潔最近棋風大變 胡耀宇:應當作打遊戲通關

2017年4月,谷歌DeepMind宣佈AlphaGo重出江湖,將在5月在中國烏鎮與現世界圍棋第一人柯潔展開三番棋較量。新浪就此相關話題採訪了人工智能專家陳經(採訪於早些時候)。

新浪:用幾句話談談您對圍棋的理解

陳經:因為我是搞技術的,所以圍棋在我眼裡是所有遊戲裡最複雜的一種。我說的遊戲是“完全信息博弈”遊戲的一種,比如中國象棋、國際象棋,子力都攤開了,大家都打名牌,但是它又很複雜。這類遊戲裡圍棋是最複雜的一個。

新浪:請您談談您觀看AlphaGo和李世石的人機大戰以及master的這60盤棋之後的感受?

陳經:既非常震驚,又非常高興。因為我長久以來對圍棋人工智能的發展很關注之前有幾次突破,比如日本的DeepZen能夠戰勝像我這樣的業餘棋手了,但能夠戰勝職業棋手還是難以想象的,以至於我們期待一個程序什麼時候能夠戰勝人類的頂尖高手,但忽然之間,好像AlphaGo已經實現了戰勝人類最頂尖棋手的目標。這個進度還是超乎了我們的預期。所以我一方面對計算機算法技術的進步感到震驚,另一方面,有個人工智能能夠領先人類棋手好像一先,有點科幻色彩,又能夠看到這種棋譜,令人很興奮。因為職業高手的棋譜有的時候就會顯得千篇一律,但是AlphaGo突破了以前的固有思維,不走尋常路,能夠讓職業棋手的技藝有飛躍的提升。

新浪:您能否直觀的從技術的角度讓我們瞭解AlphaGo在第一次人機大戰中谷歌公司使用的資源有多麼龐大?

陳經:第一次人機大戰時候,AlphaGo是用了分佈式版本的一個機器,在論文裡提到有一個單機版,單機版是一個小規模的機器,它有48個CPU,以及8個GPU。

分佈式版有1202個CPU,GPU有176個,比單機版要多大約幾十倍,從規模上來說還不是很驚人。真正規模比較大的是AlphaGo平時用於訓練的機器,據我們估計應該是在10萬個服務器以上。因為它要生成很多棋局,所以訓練用的機器CPU以及GPU規模要大得多。但是下棋的時候用分佈式的機器和單機版其實棋力相差並不是太大。我們得到的數據是AlphaGo單機版對分佈式版也有百分之三十的勝率。

新浪:從技術的角度怎麼看待master快棋的60連勝?

陳經:我們可以從兩方面看這個問題。一方面是從master對人類碾壓性的60勝可以看出它是遠高於人類水平的,這是肯定的。另一方面又是快棋,我們認為應該是放大了人類的弱點。我們估計master快棋和慢棋基本實力不會差很多,所以是一個具有完全實力的master對的是隻有20、30秒的時間思考的人類,所以人類實力是打折扣了,而人類對AlphaGo產生恐懼情緒的話就更容易出現錯著。應該說人類的發揮並不足以說明這是一個完全的測試。但有些高手覺得快棋和慢棋好像也差不多,給他更多時間他也想不出更好的招法來,或者有些高手說快棋和慢棋差一先,這是比較正常的估計。如果兩個差距在一先的高手對局60局取得60全勝也是不太可能的,所以即使人類快棋打折扣我想master和人類的差距應該也在一先以上。

新浪:請您來介紹一下圍棋的AI與象棋、國際象棋AI有什麼區別?

陳經:中國象棋和國際象棋的AI至少在10年以前用傳統的搜索技術就已經能打敗人類。當然它產生轟動效應該是1997年深藍與卡斯帕羅夫在國際象棋領域的突破。那個時候在傳統方面的搜索技術人們還是比較容易理解的。但是到圍棋網面程序就不一樣了。主要是引入了一個“機器學習”的東西,下棋和評估局面的過程都不是用人工代碼寫的,而是用“多層神經網絡”來做計算的。“多層神經網絡”在中國象棋和國際象棋代碼裡是沒有的。而且AlphaGo用這兩個神經網絡的係數是非常多的,多達幾百兆。AlphaGo更像一個在人類督促下自我訓練慢慢成為高手的人工智能。之前中國象棋和國際象棋的AI並沒有自我對局的訓練過程。關於AlphaGo的論文裡提到一種技術叫“強化學習”技術。通過自己對弈的過程修改神經網絡中的數據,棋力就會一點點的上升。這是一個革命性的技術。

新浪:那您覺得目前的AlphaGo還有什麼弱點?

陳經:以圍棋的複雜度來說,不可能就說master已經達到了完美的程度。Master的60盤雖然沒輸,但中間有沒有吃一點虧也還是可以找的到的。比如一開始和孟泰齡下的一局可能被孟泰齡的手筋擊中了,導致優勢縮水。所以我們希望能夠繼續強化AlphaGo,能夠在棋藝上探索出更深層的東西。它是利用一種算法對局面進行評估,它的論證肯定不是完善的,而是用兩個幾百兆的神經網絡計算。肯定不會完全接近真理,當然有些情況下它的理解比人要深,我們也不排除有些時候人的理解要比AlphaGo深。所以人一定要有一個平穩的心態,在局面判斷上和AlphaGo進行一個正面的較量。這次柯潔和AlphaGo的挑戰用時還沒有商定,我建議用比較長的時間比為好。AlphaGo的用時其實是無所謂的,要求時間完全是為了人類。從棋藝的角度時間長也可以讓觀眾看到更精彩的對局。柯潔比較容易犯隨手的錯誤,經常在前半盤領先,但後面就會開始下隨手棋,把大好的局面葬送了出去。如果和AlphaGo下棋發生下隨手棋這種情況就太可惜了,所以一定要有充足時間來杜絕這種情況。

新浪:請您介紹一下圍棋這種完全信息博弈和麻將、德撲非完全信息博弈的人工智能區別?

陳經:完全信息博弈就是所有信息都是攤開的,不完全信息博弈是你不知道對手的信息,所以完全信息博弈的結果一定是確定的,推理的結果是一定勝或者負。在非完全信息博弈裡,比如德州撲克、橋牌,AI的思維不是這局我一定要勝,而是在一萬手牌裡會有一次獲得較高的勝利,所以思維方式是很不一樣的。非完全信息博弈就要引入概率論情況下的搜索技術。一般認為非完全信息博弈的難度是高於完全信息博弈的。人類的優勢更多在於信息不完全的情況下。

新浪:您覺得AlphaGo對人工智能發展的意義是什麼?

陳經:AlphaGo是人工智能歷史上意義最大的幾件事之一。有很多次人工智能都陷入了發展瓶頸,但這次AlphaGo在一個看似很困的領域打敗了人類,似乎挑戰了人類的信心,從算法本身來說AlphaGo也是很有意義的,引入了“強化學習”的技術,等於一方面它學習了人類的棋譜,另一方面它還可以自我對局進行提升。這樣一個自我學習的框架是人類不能達到的。人類受身理條件的限制不可能一直下棋,而且人類還可能出現水平下降的情況,但是機器不會,它是穩定提升的。AlphaGo開發出的“訓練流水線”,對人工智能的意義是重大的,之前的人工智能研發都是小規模。這次是十幾萬臺服務器產生海量數據,這樣一種理念對整個人工智能界都是一個衝擊。

新浪:AlphaGo價值網絡和策略網絡相配合的這種方式,是否可以應該用到更多的領域?

陳經:AlphaGo下棋首先像人類一樣產生一個直覺,選擇最有價值的幾個選點。另外還對局面進行判斷,對不同的選點判斷結果,和人類棋手的思維方式有一定的相似性。如果能將這個技術應用到其他比如醫療領域,讓機器吸收醫生的經驗和思維,然後在一些關鍵的節點使用策略網絡和價值網絡做出選擇和判斷。研究AlphaGo更大的意義是為了在醫療程序上取得突破,實際上他們團隊已經有很多人轉去做醫療程序了。AlphaGo在策略網絡和價值網絡已經得到驗證的訓練方法是很有價值的,已經在醫療程序上有所應用了。谷歌可能會投入更多精力到其他領域。

新浪:您覺得從master現身到挑戰柯潔這段時間能否再次完成實力上的飛躍或者說算法上的升級?

陳經:我覺得存在兩種可能性,一種從它本身的架構來說,它每天都在自我對局,這個提升肯定不會停止,但這個過程能否使AlphaGo的棋力有本質的提升是不確定的,因為任何自我提升都是有一個上限的,它是有一個曲線的過程,一開始進步很快,後面會趨於平緩,如果AlphaGo的水平已經到了一定程度的話,給它再多的時間也很難有所提升。還有另外一種可能性,引入一種新的技術,重新開始新的訓練,研發產生算法實力的本質飛躍也是可能的。

新浪:有一種觀點說AlphaGo的代碼在人工智能領域並不算大工程,自動駕駛領域需要的代碼很多,比AlphaGo的代碼要多很多,這種觀點您怎麼看?

陳經:這種觀點是完全正確的,AlphaGo應該比之前的圍棋程序代碼量還要少,但是AlphaGo的神經網絡的係數特別多,高達幾百兆,人寫代碼不可能達到這麼多。AlphaGo的棋力祕密是隱藏在它的兩個神經網絡裡,不可能通過代碼得到,而是通過十幾萬臺服務器將數據灌注到神經網絡的係數裡,所以它不是一個簡單的工程。

新浪:您如何看待AlphaGo與柯潔的這個慢棋對決?

陳經:這次AlphaGo和之前與李世石對局不同,之前並沒有公佈太多的棋譜。這次和柯潔對戰有60局高質量的棋譜,而且取得了60比0的勝利,應該完全展現了它的實力。人類對柯潔的預期也是比較一致的:柯潔如果能取得一局的勝利應該已經算很大的一個成功了。如果柯潔全負也不是一件很震驚的事情。之前是AlphaGo挑戰李世石,甚至有人說一盤都不能讓AlphaGo贏,而這次是柯潔如果能夠取勝一盤就表明AlphaGo還存在缺陷,讓AlphaGo繼續提升,到最後和國際象棋一樣宣稱不可能輸給人類了。當然我相信現在還沒達到這種程度。柯潔對AlphaGo能夠有1到2局勝利對職業棋手來說是件很歡欣鼓舞的事情。

新浪:既然現在AlphaGo已經如此強大,為什麼還要可柯潔對戰?

陳經:首先谷歌公司二老闆個人對圍棋是非常感興趣的,包括AlphaGo和李世石對戰的時候還親自到了韓國。即使不考慮勝負,從棋藝本身來說也是非常有價值的。只有在慢棋這種比較公平的測試情況下才能夠不僅讓職業棋手信服,也讓開發團隊比較有信心。谷歌團隊在這方面還是比較保守的和謙虛的,在沒有充足的證據時不會做出誇張的宣稱。Master60連勝後他們只是說一起和職業棋手探討圍棋中美妙的部分。

新浪:請您給柯潔一些建議

陳經:首先柯潔的目標應該是對AlphaGo取得一局勝利就成功了,他應該作為一個完全挑戰的心態準備這次比賽,這有利於他實力的發揮。同時他必須對AlphaGo下棋的過程有了解,如果不知道對手是怎麼做出決策的就會感到慌張,所以一定要把AlphaGo看成一個可以理解的對手。和懂算法的人進行交流,理解AlphaGo的思維。第二,如果AlphaGo在中盤取得優勢,不建議柯潔糾結於如何收官子,應該把決勝點放在前半盤,當然後半盤要頂住,不能將優勢葬送。柯潔應該主動把局面倒向自己擅長的部分,應該建立信心,對一些局面自己估算比AlphaGo要準確的時候,要相信自己確實取得了優勢。

(文玄)

科技圈如何解讀人機大戰 顏水成將帶來專家點評

360人工智能研究院院長顏水成

5月23日至27日,中國烏鎮圍棋峰會將在浙江烏鎮召開,柯潔與谷歌AlphaGo的三番棋比賽吸引著全世界的關注。比賽目前已經進入倒計時階段,新浪網本次也將在前方派駐專業報道團隊帶來第一現場的報道,並在北京新浪總部演播室精心策劃了視頻直播,為網友奉獻一場全方位的點評。

360副總裁、首席科學家、人工智能研究院院長、國際知名計算機視覺與深度學習專家新加坡國立大學副教授顏水成,將作為前方嘉賓,去比賽現場體驗圍棋峰會,同時給大家帶來人工智能專家視角的解讀。

顏水成簡介:

顏水成,360副總裁,首席科學家,人工智能研究院院長,新加坡國立大學終身教職,IEEE Fellow, IAPR Fellow 及 ACM 傑出科學家。他的主要研究領域是計算機視覺、機器學習與多媒體分析,發表近500篇高質量學術論文,論文引用過2.5萬次,H-index 70。2014、2015、 2016 三次入選全球高引用學者 ( TR Highly-cited researchers )。此外,他領導的團隊在五年內曾7次獲得計算機視覺領域核心競賽 PASCAL VOC 和 ILSVRC的 winner 和 honorable-mention 獎項,10餘次最佳(學生)論文獎項,曾取得多媒體領域核心會議 ACM MM 最佳論文獎,最佳學生論文獎,最佳技術演示獎的大滿貫。

相關推薦

推薦中...