如何看待AlphaGo Zero通過完全自學100-0完爆AlphaGo？

Nature今天上線的這篇重磅論文，詳細介紹了谷歌DeepMind團隊最新的研究成果。人工智能的一項重要目標，是在沒有任何先驗知識的前提下，通過完全的自學，在極具挑戰的領域，達到超人的境地。新一代的阿法元(AlphaGo Zero), 完全從零開始，不需要任何歷史棋譜的指引，更不需要參考人類任何的先驗知識，完全靠自己一個人強化學習（reinforcement learning）和參悟, ，棋藝增長遠超阿法狗，百戰百勝，擊潰阿法狗100-0。你如何看待？如何看待AlphaGo Zero通過完全自學100-0完爆AlphaGo？

7 個回答

有趣的人工智能

2017-10-19

橫空出世，橫掃圍棋界所有世界冠軍，去年吊打韓國棋手李世石、今年元旦車輪戰人類頂尖棋手，5月虐哭中國棋手柯潔的機器人AlphaGo，這兩天又火了！

如何看待AlphaGo Zero通過完全自學100-0完爆AlphaGo？

因為昨兒，AlphaGo的開發公司DeepMind 在《自然》雜誌上發表了一篇論文，題目很嚇人，叫《無須人類知識掌握圍棋》，並正式推出人工智能圍棋程序的一個最新版——AlphaGo Zero，讓業界為之一震。

如何看待AlphaGo Zero通過完全自學100-0完爆AlphaGo？

AlphaGo這貨，雖然在和柯傑的對戰之後，宣佈退役閉關，不再參加任何比賽，無敵最是寂寞，但是AlphaGo沒有停止學習，不斷迭代，這個代號AlphaGo Zero的新版AlphaGo牛逼大發在哪兒呢？

如何看待AlphaGo Zero通過完全自學100-0完爆AlphaGo？

這個新版AlphaGo Zero僅僅花了3天時間，和自己左右手互搏數百萬盤的自我對抗之後，輕鬆地以 100 比 0 的成績擊敗李世石版本的AlphaGo，21天后超過AlphaGo Master版本（與柯傑對戰的AlphaGo版本）。

如何看待AlphaGo Zero通過完全自學100-0完爆AlphaGo？

也就是說，AlphaGo Zero完成了一次自我顛覆，不僅超越了人類，順帶把自己也給超越了。

之前的AlphaGo版本呢，基於大數據和算法，用了海量人類圍棋比賽數據來訓練如何學習圍棋，然後再來和人類下棋，這事兒吧，就有點像慕容復的以彼之道、還施彼身。

如何看待AlphaGo Zero通過完全自學100-0完爆AlphaGo？

而AlphaGo Zero的獨門祕籍不再是偷學人類棋譜，AlphaGo Zero是無師自通，自學成才！該系統的神經網絡最初對圍棋一無所知，然後與強大的搜索算法結合進行自我對弈。從0開始練3天超過了人類棋手200年的積累，這要是放在金庸的武俠小說，AlphaGo Zero絕對是不世出的武學奇才！

如何看待AlphaGo Zero通過完全自學100-0完爆AlphaGo？

DeepMind AlphaGo項目首席研究員David Silver表示：“AlphaGo Zero是迄今為止最強大，最具效率，最有通用性的 AlphaGo 版本。”

如何看待AlphaGo Zero通過完全自學100-0完爆AlphaGo？

不過，問題來了！很多人都納悶，在圍棋界打敗人類無敵手的AlphaGo為什麼不來下中國象棋？

前阿里巴巴總裁衛哲去美國造訪了DeepMind的AlphaGo團隊，就問了這個問題：你們AlphaGo怎麼不搞搞中國象棋？

AlphaGo團隊工程師回答道：“這個不是說我們願做不願意做的問題。圍棋幾百年來的棋譜都存在，也就意味著圍棋的數據特別齊全。咱中國象棋老祖宗留下了什麼？叫殘局。機器人程序怎麼走到殘局呢？不知道，沒有數據。”

所以吧，這個故事說明：大數據對人工智能的重要性。沒有大數據，談人工智能就沒有意義。

如何看待AlphaGo Zero通過完全自學100-0完爆AlphaGo？

也說明：AlphaGo很厲害，但是，和AlphaGo比起來，咱老祖宗還是很有遠見的^_^

路人甲M

2017-10-19

中國棋手柯潔在得知AlphaGo Zero的消息後，第一時間發微博表示：人類太多餘了...... 如何看待AlphaGo Zero通過完全自學100-0完爆AlphaGo？

在圍棋比賽上，谷歌旗下DeepMind團隊的人工智能程序AlphaGo橫掃世界頂尖棋手的事情，早已不是新聞。就在昨天凌晨，DeepMind在一篇論文中詳細介紹了迄今最強大的一版AlphaGo—— AlphaGo Zero（阿爾法元）。而這個新AI自學3天就以100-0完爆了當年的阿法狗。

如何看待AlphaGo Zero通過完全自學100-0完爆AlphaGo？

新一代的阿爾法元有多厲害呢？

他的特點在於，AlphaGo Zero除了使用圍棋規則，完全擯棄了人類棋手的知識和棋譜，從零開始學起，大概學習21天就能完勝柯潔，學習40天就能完勝之前的任何AlphaGo版本。

阿爾法狗的前幾代版本，都是通過用上千盤人類業餘和專業選手的棋譜進行訓練，學習如何下圍棋。而Alpha Zero，則直接跳過這個步驟，自我對弈下圍棋，也就是說用自己的左手和右手下，完全從亂下開始，用這種方法超越了人類的水平。如何看待AlphaGo Zero通過完全自學100-0完爆AlphaGo？

論文原文：（https://deepmind.com/blog/alphago-zero-learning-scratch/）

那麼短短一兩年，我們可以看到人工智能的發展非常迅速。但很多人就會說這些AlphaGo人工智能垃圾，除了下棋還會幹什麼。

但我覺得不是這樣想的，市面上有無數針對下棋的程序，但並不是每個都是隻是為了下棋的，DeepMind的開發團隊沒有幾個是懂圍棋的，他們開發AlphaGo 並讓它與人類下圍棋，只是為了讓它找到邏輯判斷的方式並不斷自我學習，這些是人工智能深度學習的基礎。

AlphaGo 發揮創意的那些時刻表示著，人工智能將成為創造力高於人類的存在，並幫助我們解決人類面臨的一些最重要的挑戰。

至於人們說的什麼AI覺醒之類的事情，不管信不信吧，目前看來還是很遙遠的事，目前他的研究方向還在於，當它擁有了這些能力之後，它可以迅速學習其他方面的能力，並最終服務人類。

Teku特酷

2017-10-20

悟空問答的網友大家好。AlphaGo Zero取得的進展是重大的，它已經將人工智能做到了極致。

此前，AlphaGo通過深層神經網絡進行決策，並使用人類專家下棋的數據進行監督學習，同時也通過自我對弈進行強化學習。但是現在，他“無師自通”，僅用3天時間就達到了擊敗李世石的AlphaGo Lee的水平，21天達到了之前擊敗柯潔的AlphaGo Master的水平。

在3天內，也就是AlphaGo Zero在擊敗此前版本的AlphaGo之前，曾進行過490萬次自我對弈練習。相比之下，此前版本的AlphaGo Lee的訓練時間長達數月之久。AlphaGo Zero不僅發現了人類數千年來已有的許多圍棋策略，還設計了人類玩家以前未知的的策略。

AlphaGo Zero驗證了即使在像圍棋這樣最具挑戰性的領域，人工智能也可以通過純強化學習的方法自我完善達到目的。

雖然谷歌DeepMind已經把人工智能做到了極致。但是即使是最新版本的AlphaGo，也仍然是基於強化學習，它的先進之處是過去需要人類給他喂數據，做大量訓練，現在不用了，機器自己就能基於經驗做決策，這是一大進步。下一步就是要發展純的自學習了。

另一方面，AlphaGo的研發團隊已經開始把精力投入到其它重大挑戰中，研發出更為高級的通用算法，幫助科學家們解決最複雜的問題，包括找到新的疾病治療方法、顯著降低能源消耗、發明革命性的新材料等。DeepMind稱，如果人工智能能夠在上述領域發現新的知識和策略，那在這些領域的突破將十分可觀。

更多內容，歡迎關注#Teku特酷#

Lauzi

2017-10-21

據阿法狗公司深心（DeepMind）主人介紹，阿法狗的算法是通過對圍棋大師們的佈局圖像模式的大數據研究模擬而成。由於圍棋規則太簡單，按規則複雜的國際象棋一樣的走法概率算法行不通，因為圍棋開局的每一步走法可能的選擇數量超越了已知宇宙所有的星星數量。因此無論哪位大師對弈大哥阿法狗等於對弈所有大師的集合，必敗無疑。小弟阿法元的算法則完全避開了人類的佈局模式和大數據、從零開始，在不斷替換不斷提高的模擬對手的引導下，小弟在幾天之內就完成了大哥在幾個月內完成的培訓，幾乎無師自通，並以絕對優勢擊敗了大哥。主人很驕傲，認為只是第一性原理（first principles）的勝利，關鍵在於算法的重新（從零）設計。我們對此表示讚歎、祝賀，這算得上人工智能史無前例的成就。主人還表示深心超越了人類智能，如此第一性原理、“白手起家”（tabula rasa）的算法可以沿用到任何領域。我是個儒家學徒、懷疑論者，忍不住要潑點涼水。

首先，圍棋只是個“二維”空間的遊戲，很簡單，而現實是個複雜的“三維”空間。就像天體物理學，兩個天體間的運動可以模擬、計算，三個天體以上數學理論甚至計算機模擬就束手無策了，換言之，牛頓定律、愛因斯坦相對論可以計算太陽與地球的天體互動，加個月亮數學就死了。就遊戲而言，兩個玩家可以在博弈論中列表、一目瞭然，三個玩家就無法列表了。事實上，古希臘人是第一性原理的鼻祖。我們都學過平面幾何，歐幾里德就是從簡單的公理、特理、定義開始進行他的推算和邏輯論證，換言之，他可以從已知的定理滴水不漏地推算出全新的定律。深心的算法或思維繼承了歐幾里德的哲學，就是我們還不太熟悉的形而上學。深心的人工智能在圍棋界的成就要歸功於古希臘。歐洲文藝復興時期的科學家如牛頓、伽利略等和哲學家如斯賓諾莎、康德等均對歐幾里德敬若神靈，可以說沒有古希臘形而上學就沒有歐洲的文藝復興、科學革命，甚至也不會有現代愛因斯坦的相對論，後者的數學理論就是幾何。不可否認形而上學在理論科學的應用，但它在複雜的現實特別是社會現實就很難行得通，如康德就企圖按第一性原理推出整套哲學體系，這種“白手起家”的算法只能以失敗或不了了之而告終。哲學、人文學的基礎或前提必須是真實的自然而不是想象的超自然。

其次，在“三維”世界，人對機器的信息輸入和操作必須轉換為數碼、數學和邏輯的方式，由此機器對人類知識積累的接受就打了個折扣，事實上，人在知識信息輸出前對自然的第一認知學習已經打了第一折扣。由此可見，人工智能想在整體上超越人類智能原則上是不可能的。

除了空間維度和信息輸入方面的侷限，人工智能有一點永遠不可突破的區域就是意識和情感，情感來自意識，而意識來自自然和有機的炭基生命，指望無機的硅基機器有朝一日產生情感無疑是天方夜譚。我有位性格浪漫的朋友經常在微信個人圈放嗮微軟的智能機器小冰寫的詩。據說小冰花了四天時間學習寫詩，然後就寫了136首詩，分別刊登在北京晚報等報刊雜誌上。這是她的新作：

《用別人的心》：“他們的墓碑時候/我靜悄悄的順著太陽一樣/把全世界從沒有了解的開始/有人說我的思想他們的墓碑時候/你為甚在夢中做夢/用別人的心/又看到了好夢月。”

我對他的讚譽是，浪漫到了相信機器也能浪漫。有點類似我們對阿法元的熱烈反應。就意識而言，無論是阿法哥還是阿法弟，他們毫無意識到自己在下圍棋，更沒有"自我"。

地震博士

2017-10-19

很正常，既然AlphaGo的第二代已經可以自己每天對局一萬局左右，從而遠超第一代AlphaGo。那麼，意味著隨著學習能力的不斷提高，AlphaGo Zero必然會達到完全自學100-0完爆AlphaGo的程度。其實，人類越發展AI，也越能瞭解人類自身的思維能力，其實沒那麼神祕！比如以前說電腦想識別遠處來的一輛汽車，必須測量車的速度，長寬高等參數來進行識別！而人類卻通過模糊的感覺就可以判定！其實人類也是通過車的聲音等來確定的！隨著傳感器技術、衛星、物聯網、互聯網、大數據等技術的發展，AI獲取的信息遠超人類、處理信息的能力由於先天的優勢更是遠超人類，因而決策能力也遠超人類就一點兒也不奇怪了！

镁客网

2017-10-19

倫敦當地時間10月18日，DeepMind團隊公佈了最強版AlphaGo，代號AlphaGo Zero（阿爾法元）。從DeepMind團隊發佈的AlphaGo Zero的相關研究論文看，AlphaGo Zero有一獨門祕籍，就是可以自學成才。

眾所周知，AlphaGo是在結合了數百萬人類圍棋專家的棋譜後，通過機器學習才達到“戰無不勝”的程度的。但AlphaGo Zero卻是不需要人類輸入數據，從零基礎開始學習，並在3天時間內完成了近5百萬盤的自我博弈後，成為頂級高手的。研發團隊稱，AlphaGo Zero的水平已經超過之前所有版本的AlphaGo，並在與其對陣時（該版AlphaGo曾戰勝韓國棋手李世石）取得了100:0的壓倒性戰績。

可以說，AlphaGo Zero使用了新的強化學習方法，從單一神經網絡開始，通過強大的神經網絡搜索算法，已經不需要再受到人類的限制了。此外，DeepMind團隊還表示，AlphaGo Zero已經能夠獨立發現遊戲規則了，並可以制定自己的下圍棋策略。

對此，中國棋手柯潔稱：人類太多餘了。。。

可以看到，人工智能技術的正在具備其自己的創造力，更有望在未來超越人類。儘管AlphaGo Zero仍處於發展初期，但它已經到達了一個關鍵點，零基礎自我學習。可以期待，如果類似的技術可以應用到蛋白質摺疊等其他結構化問題或他領域中，如基因工程、未來醫療、新材料探尋等的突破上，它將極大的推動人類社會的發展。

李俊慧

2017-10-20

從概念上來看，“人工智能”（Artificial Intelligence，英文縮寫為AI）並非新概念，早在上世紀90年代就有科學家提出。

有觀點認為，人工智能作為計算機科學的一個分支，也有觀點認為，除了計算機科學以外，人工智能還涉及信息論、控制論、自動化、仿生學、生物學、心理學、數理邏輯、語言學、醫學和哲學等多門學科。

但是，不管怎樣，人工智能的發展歷史是和計算機科學技術的發展史聯繫在一起的，同時，人工智能技術企圖瞭解智能的實質，並生產出一種新的能以人類智能相似的方式做出反應的智能機器，該領域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統等。

以人工智能領域的圖像識別技術為例，國家知識產權局網站的統計數據顯示，我國最早與圖像識別相關的專利申請發生在1993年。

當時，中國科學技術大學提交了一項名為“圖像識別火災監測報警裝置”的發明專利申請，該專利技術主要原理是“在軟件支持下，用像素點灰度值判別有否火焰存在，以影像面積增長率識別是火焰還是火災”。

顯然，根據其技術原理及實現方式，這項早在1993年就提交的發明專利已經具備了很強的“人工智能”理念或原理。

而從其應用領域或場景來看，通過圖像識別技術防範火災隱患，如果和當下的“互聯網 ”相結合，堪稱“互聯網火災預警”應用典範。

不過很可惜，這個23年前提交的發明專利中途因未及時繳納專利費已經失效。

但這也從一個側面說明，人工智能確實並非新概念，其研究和應用也並非剛剛起步，而我國在人工智能相關細分領域也並非全面落後於發達國家。

1997年深藍大戰卡斯帕羅夫，在當時也是被認為屬於人工智能領域的重要成果和重大進展，它告訴我們通過“電腦或計算機”可以替代部分人的工作，隨後，電腦及互聯網應用席捲全球，不僅帶來了全新的技術革命，也深刻改變了很多行業或產業。

2016年，“阿法狗”對弈李世石，則讓更多人領略了人工智能領域的“大數據或深度學習”的魔力，它讓人看到了“機器”或“系統”更多的可能，甚至有替代人做推理或決策的可能。

如今，AlphaGo Zero通過完全自學100-0完爆AlphaGo，則讓更多人看到了更多的可能，並對科學或技術產生濃厚的興趣和關注。

但是，一方面，我們要看到人工智能技術進步給科技產業及傳統產業帶來的積極影響，另一方面，我們也要注意人工智能還不能等同於“機器萬能”，它可能還存在這樣或那樣的問題有待解決。

而具體到產業發展和技術佈局，對於人工智能領域可能涉及到的大數據技術、語言識別技術、圖像識別技術等各類新技術，不僅需要研究及時跟上，更需要專利佈局和保護及時跟上，並在前述基礎上參與或建立相關技術標準的制定，為以後更廣泛的行業或產業應用打下堅實的基礎。

如何看待AlphaGo Zero通過完全自學100-0完爆AlphaGo？

相關推薦