微軟副總裁洪小文:AI黑盒無法承擔重大決策,AI+HI是終極智能形態

物聯網 微軟 微軟小冰 人工智能 億歐網 2017-05-14
微軟副總裁洪小文:AI黑盒無法承擔重大決策,AI+HI是終極智能形態

圖片來自網絡

微軟全球資深副總裁、微軟亞太研發集團主席、微軟亞洲研究院院長洪小文老師的到來讓本週的北大AI公開課備受矚目。在這堂接近兩小時的公開課上,洪小文博士滿是乾貨的演講以及和北大人工智能創新中心主任、百度七劍客之一雷鳴老師的精彩對話,讓教室掌聲、笑聲不斷。我們先為您呈上本課精彩內容的摘選,然後是整堂課全程實錄的大餐。

洪小文博士近兩個小時的演講+問答是從一本書開始說起的—《Thinking, Fast and Slow》。這本書的作者是一個諾貝爾經濟獎的得主,他把人類思考的行為分成兩大塊,一個是我們不假思索,一個是需要好好想一下的。根據這一理論進一步細分,洪老師提出有關AI能力的三個問題:

1、感知:這是貓還是狗?——這是個不假思索的問題(Think Fast)

2、認知:這是喜劇還是悲劇?——這個要好好想一想(Think a little bit Slow)

3、決策:微軟是否要買下LinkedIn?——重大的決定(Think Slow)

感知:人工智能正在從各個方面超越人類水平,幾行代碼輕鬆實現人臉識別

對於第一個問題,涉及語音識別、圖像搜索、圖像識別,人工智能已經解決的很好。洪小文提到2015年,微軟亞洲研究院的深度殘差網絡做到152層的時候,在ImageNet上的錯誤率只有3.5%,低於人類5.1%的錯誤率。更不用說現在還有上千層的深度神經網絡。

在2016年COCO圖像分割比賽中,微軟亞洲研究院再次獲得了第一名,比2015年的成績(當時也是微軟第一)進步了33%,超過2016年的第二名谷歌的性能11%。

微軟對於這些認知、感知,將其做成微軟認知服務,裡面有計算機視覺、語音識別跟自然語言識別,知識還有搜索,通過API的形式,讓學生們、老師們和各個開發者不需要掌握人工智能的專業知識,也可以開發出屬於自己的智能應用,從而把AI普及化。Uber、可口可樂都用人臉識別做很多東西。

洪小文還提到前兩年風靡的How-Old.net就是用微軟認知服務的API,它的人臉識別功能可以識別性別、年齡,而這個應用只用了幾行代碼。

認知:大數據隨物聯網崛起,分析、預測、決定全面進入自動化

洪小文介紹,我們有了物聯網隨時蒐集數據,就會有更巨大的數據幫我們實現自動化。在控制系統中有FeedbackLoop的概念,其中包括驅動器(Actuator)、物理世界(Physical World)、傳感器(Sensor)、分析(Analysis)、決策(Decision)。

洪小文舉例到,例如想治理河流,先有傳感器檢測水質、之後再分析決定,每一次完成一個Loop都會進步。隨著更多傳感器隨時隨地收集數據,就能完成更多的Loop,系統提升就越明顯。人也可以用可穿戴設備形成這樣的系統,以隨時監測健康,提前預警健康問題。微軟目前和勞斯萊斯飛機發動機合作,進行飛機油量的自動化管理。不論是監測監控還是監控飛機油量,都是重複性的工作,非常適合AI做。

決策:AI黑盒無法承擔重大決策,AI+HI是終極智能形態

人有因果推理,而現在的AI是黑盒子,對於重大決策,我們不會放心交給系統做。這種非重複性任務,讓AI去做的價值值得商榷,同時複雜決策常常不是在一個封閉的系統中作推理,它的涉及面太廣。

但是AI是否就無法為決策提供價值了呢?AI利用其大數據的處理分析能力,可以為我們推薦值得注意或者研究的點,但裡面的道理還要人類自己去求證。正如微軟的AnnaTalk,用自然語言提問,系統給出初步的分析結果。AI與HI配合,可以讓我們做出更好的決策。

AI威脅論由來已久,人類早已朝著AI+HI共進化狂奔了

洪小文對AI報以樂觀的態度,並不認為AI真的會威脅到人。曾經1950年二戰結束不久,全世界的計算機用兩隻手就數的過來的時候,時代雜誌就開始宣傳機器威脅論。現在回想起來,蠻不可思議的。

洪小文提到他曾經最傷心的是小學一年級沒有被選進珠算隊,可是現在的年輕人沒有幾個會拼命學習珠算。所以人類在圍棋上被AI打敗也沒什麼好傷心的,就像現在也不會有人因為珠算算不過計算器而傷心了。

事實上智能的四個層級:感知、認知、創造力、智慧,人類被碾壓到1.5層,也就是說大多數常用感知、聽、看都被超越了。認知也有相當一部分被超越。

人類應當習慣,就像計算能力和記憶力,我們覺得機器比我們強是很正常的。我們其實早就朝著人類智能和人工智能共同進化的路狂奔了。

微軟硬起來,硬件做的比蘋果還好

洪小文說:“最近很多人說,微軟的硬件做的比蘋果的還好”。微軟的混合現實設備HoloLens馬上要在中國上市了。

蒂森克虜伯電梯公司的維修人員用HoloLens為電梯進行維修已經用了很久了。AI的確對職場工作產生了一些變化,但我們不是被取代,而是用AI做的更好。

AI=Augmented Intelligence

Human+Machine=Superman

洪小文認為人工智能確實很多方面比人強,但是他也認為人的不完美可能正好造就了我們的創造力。

關於機器意識,他認為完全沒有必要糾結造出有意識的機器人,而是應該造出有用的機器,以及不會失控的機器,如果非要造有意識的,不如多生點小孩。理想的機器助手應該沒有意識,但是又會察言觀色就像微軟小冰。

關於奇點會不會到?AI是不是可以持續讓世界越來越好?洪小文認為就算有一天做到了強AI,解決了一個難題,這個世界還有很多未解的難題,雷曼猜想、P等不等於NP,甚至宇宙從哪裡來,有沒有大爆炸,將來宇宙會不會再縮小,總有一個問題可能永遠無解。他認為AI=AugmentedIntelligence,Human+Machine=Superman。人和機器的共生才是終極形態。

對於AI技術的研究方向,他建議把目前深度學習這一套和以前做白箱的認知結合起來。另外洪小文表示非常看好物聯網,與其相關的傳感器做到又小、又省電、又方便、又準,是一個很有挑戰的研究方向,不僅僅是軟件的問題,還有物理和材料方面的挑戰。

洪小文認為數字化轉型一定會席捲所有公司,只是用的多少和早晚有差別。他提到微軟有很多AI+工業的應用,包括跟勞斯萊斯、蒂森克虜伯電梯公司的合作。

AI的滋養:雲是氧氣,數據是水

微軟押注雲和AI。洪小文認為雲和物聯網都很重要。雲和物聯網結合以後,不用擔心計算,也不用擔心數據。AI需要的兩個重要的氧氣和水分,一個就是數據,一個就是計算。對於做AI的公司而言,雲是一個不可或缺的氧氣。

AI分化就是貧富分化

AI+HI是否會造成人類的分化?無法和AI結合的人是否會沉入底層?洪小文認為,分化一直都有。前幾年有數字分化,將來有AI分化,其實本質就是貧富差距。我們希望人人平等。政府有責任把稅收、社會福利系統做好。而微軟這種大企業可以在計算資源平等上出力,微軟特別拿出10-20億價值的雲資源專門給付不起錢的地區使用。

洪小文老師個人宣講實錄

很高興今天有機會跟大家來分享,謝謝雷老師開課,大家也上過很多前輩講的課。這個課接近尾聲時我會談一下從現在怎麼看未來人工智能的發展。我覺得到最後將會是人工智能跟人類智能的共同進化。

我今天用一個方法來介紹一下,大家對未來人工智能哪一些東西能做,哪一些東西不能做。首先跟大家介紹一本書,這本書叫做《Thinking,Fast and Slow》,這本書的作者是是一個諾貝爾經濟獎的得主,這本書是商學院經濟學系通常都會用的,他把人類思考的行為分成兩大塊,一個是我們不假思索,一秒鐘之內就想好的。還有一個東西我需要想,而且要想很久,這裡面我再細分,分成有些東西我們想的非常快,比如說給你看一個是貓還是狗?這個可以馬上回答。還有一些要思考很久,比如說大家看到這個劇照,這是一個喜劇還是一個悲劇?

這種東西顯然要稍微想一下。這是一部美國電影,如果有人認識這個男演員說他拍的90%是喜劇,就猜錯了,這是他拍的很少數懸疑的悲劇叫做《23》,所以必須要拿著圖片去找,就算有這些錄像還要一幀一幀的去找,或者要做一個人臉識別那個女的是誰,再查這兩個人同時在哪一部電影出現。

還有一個問題,大家都知道我們去年決定收購LinkedIn,現在已完成收購,這種事情在商業裡面常常都是這樣,我們該不該,該花多少錢收購他們,這種問題基本上都是大的決定,一輩子只做一次。既使你說去年我們決定不買,今年決定想買的話價格也不一樣,時過境遷什麼都不一樣了,你要重新思考。

人也有很多這樣的問題,你們進北大以前該報考哪一個學校,該報考哪一個系,我保證你們要稍微想一想,我不相信有人說10秒鐘就知道決定。甚至於人生大事男女朋友該不該跟對方求婚,這種人生大事你一定想了很久,而且還問了很多人的意見,最後你做出決定,這種事情都是想很久。

現在我目前用人工智能所做的項目,特別是微軟所做的跟大家介紹一下,以這個為例子,不是微軟自己做,大家都在做。

第一個問題就是作為感知的問題,語音識別、圖像搜索、圖像識別,大家可能知道有一個ImageNet,在計算機圖像識別上是一個公開的database,每年都有比賽,微軟在2015年12月份憑藉深層神經網絡技術的最新突破,第一次超越了人的水平,實現了錯誤率3.5%,而人的是5.1%。大家到今天一定聽說過什麼叫深度學習,當時我們拿到第一名的時候,是世界上第一次用上百層,到現在已經上千層了。

大家可能會說深那就越深越好,但真正做的時候你就會知道,你越深需要Data越大,需要計算量更大,很多時候是跑不完的。怎麼樣讓一樣的data能夠把結果做上去,同時還能夠算出來,這個東西還需要很多的研究和功力。而且深度學習只是在辨認哪一些是圖像,實際上一個圖像裡面有很多物體,像一個簡單的照片裡面就有十幾種物體,不但要辨認出每一個是什麼,還要把它劃出來才有用。有另外一個比賽COCO,這裡面比的是比劃出來還難,要做到像素級別的識別才算正確。微軟亞洲研究院我們多年參加這個,2015年我們是第一,去年也是第一,而且領先很多在業界大家很熟悉的人工智能很牛的公司。

我們這個算法不止可以做的很準確,還可以做的很快,所以我們在Video每一幀每一幀去做,最起碼24幀甚至有到60幀的,我們可以做到實時,所以就可以做很多應用。

剛才講的只是把它框出來,甚至還有一個task叫你要講出這個圖片要幹什麼。所以給你一個Video就更難,有一個人在彈琴,有一個人在讀書,要把這個做成一個服務,大家有興趣可以看一下www.captionbot.ai,你可以上傳任何一個照片,像這個不僅知道它是三明治,還知道三明治被切了一半,我們剛才講的VideoCaption也有這個技術。

微軟對於這些認知、感知,我們就把它做成微軟認知服務,裡面有計算機視覺、語音識別跟自然語言,知識還有搜索,都把它做成API每個人都可以調用,讓學生們、老師們和各個開發者不需要掌握人工智能的專業知識,也可以開發出屬於自己的智能應用。目前為止,Uber、可口可樂等都用我們的人臉識別做了很多東西,像Uber,司機要開車以前會跟Uber登記他是誰誰誰,要做一個人臉識別,確定他是那個人,不能代駕,他才可以接Uber的活,這個是用我們的技術。

機器翻譯其實在中國現在用處是最大的,很多遊戲在國外有玩家玩,在上面就可以做。LUIS可以做聊天機器人,中國中信集團,新加坡政府等都在用。我們最近剛上線的就是OCR甚至是手寫OCR,在我們的OneNote等上面都有。我們不僅在做API,同時我們也在做應用,其中一個很有名的叫做How-Old.net,兩年前推出的時候,一時之間馬上變得全世界瘋狂,上傳照片就可以知道圖裡的人是男的還是女的,幾歲,很多人到今天還不知道這個是微軟做的,而微軟做這個的目的不是要做應用,目的是要展示微軟認知服務的特性,因為How-Old.net裡面源代碼總共只有幾行,有了API想一些設計參數以後就上傳照片,回來就有這些照片裡面所有的信息,所以整個應用只用了幾行代碼,我們做這個的目的就是要讓AI普及化,讓大家能夠有一些好的想法去做AI的應用,不需要每一個人都把所有的AI技術去學一遍。

在中國我想大家知道微軟小冰,日本叫Rinna,在美國叫Zo,小冰到今天其實是各個智能的結合,它不僅有自然語言的聊天,它也有語音,它也有視頻,也有照片,譬如說像有人上傳一個狗的照片,小冰的目的不是說辨別這是什麼狗,通常人看到狗可以聊什麼呢,可以聊狗的主人,可以聊什麼樣的人喜歡這個狗,你可以說哪一個有名的人長的很像這個狗。這樣的話就有東西可以聊下去,我們對小冰衡量的方法就是用戶跟小冰聊了幾個回合,一問一答叫一回合,目前小冰在中國大概平均是25輪,25輪很了不起,因為你自己跟你朋友親人微信上聊的話,我估計每次大概是3到5輪,小冰是平均25輪。

同樣,我們跟京東合作我們有這些書,如果說辨別書,這是哪一本書那就聊完了,所以你可以聊書的內容。

在書方面,可以聊作者,聊喜歡什麼類型的書;在衣服方面,可以辨認出布料,種類,款式。我們會在社交網絡上看大家的聊天內容,如果大家接下來會聊針線活,那麼機器可能也會聊同樣的話題。在人的方面,主要是認知服務,機器能夠根據照片判斷性別,年齡,twins or not。如果顏值在一個區段,可以聊外表;如果顏值在另一個區段,可以聊內心。小冰是所有這些感知服務的集成。

第二個問題就是think a little bit slow,很多問題很複雜。在我看來每一件產品都是可以應用這張圖。如果現在有一個sensor(傳感器),就可以在物理世界收集數據,接著可以進行分析、決定下一個產品要做什麼,下一個行業要做什麼,之後再有actuator(驅動器)。比如,我想治理北京附近的河流,先有一個 sensor 去測試水值,之後再分析、決定。每一次完成一個loop都會進步,完成的越多,進步越明顯,這在控制工程中叫feedback(反饋迴路)。以前我們要派人去收集數據,需要花費很多時間。如今,我們有IoT,隨時隨地可以收集數據。

人的身體也是如此。在加護病房中,會測試病人的鉀、鈉等元素,一旦發現數據偏離正常值,醫院就會有所行動,使得人體維持在正常水準。以後,當人長出第一個癌細胞的時,可能就知道,越早發現就越容易治療,可以利用穿戴式設備等。我剛才講的觸發者和傳感器,就是所謂的物聯網,能夠收集大量數據。如果有大量的運算能力,你就可以把它自動起來,當然也包括很多深度學習的算法。

現在為什麼AI這麼紅火,雖然這個系統很複雜,但是可以自動化,把它連起來。舉一個商業例子,叫預防性維修(PredictiveMaintenance),與剛才異曲同工。

微軟大樓裡面都有電梯,以前怎麼維修。一旦電梯壞了,就打電話讓電梯公司來維修,電梯公司隔了幾天派人到這個大樓來,然後將一個東西插上去,叫rs232。接上去以後像一個PC,下載一些數據,然後拿回去分析,又隔了一兩個禮拜,然後找到問題了,再派一個人過來維修。幾個禮拜電梯都不能工作。現在,就在上面裝一堆傳感器,收集電梯運作的速度,發出的聲音等數據,並傳回公司。在電梯壞之前,有預防性維修(PredictiveMaintenance)。

如果聲音不對了,阻力大了,速度不均勻了,在還沒有壞之前,就派人去維修。這在工業界,已經鋪天蓋地了。可以想象,在機械沒有壞之前你就可以去維修的話,可以省下很多金錢和時間。

其實講物聯網並沒有幾年。之前溫總理當年在無錫講物聯網。將來萬物都會放上傳感器。若要知道牛的品質,奶的品質,肉的品質,就在牛、水等物體上安裝傳感器。物聯網就這麼回事,但是非常重要,沒有這些數據,AI沒戲,AI只是算法。微軟有很多數據,並提供從收集數據,到大數據分析,到可視化等。我們有很多夥伴,比如勞斯萊斯,勞斯萊斯的引擎特別有名,生產很多飛機的引擎。

其實飛機公司最大的成本就是油錢。若飛機載油多,重量增加,就會用更多的油;若載油少,遇到天氣逆風,會變的不安全。通常如果飛機較慢,80%都是與油的量有關。因此,在飛機公司,油的管理是最重要的一環。那麼現在有了這個系統可以省油,因為能夠預測航行路線,風向,氣候,重量。

我上一次飛機誤點很荒謬,都算好之後,又載了一些貨。貨放的多了,就要想辦法加油還是卸貨。最後慢了六個小時。有了這個機器就簡單了,可以記錄飛機有多少重量,左右多少可以平衡,天氣如何,路線,然後就可以預測,就可以做的比較精準。這就是FeedbackLoop的重要性。

我們做技術的人希望把AI技術,把算法做得更好,但是別忘了最後還是因為這些數據的取得,數據取得的快速程度可以讓你實現很多東西,這又是一個很好的例子。將來可能會做一些稍微慢的東西,但你會重複的做,這些交給AI很適合。加上物聯網後,就能夠全面自動化。

第三類的問題比較特別,一個東西若要thinkslow,然後makedecision。通常,這樣的系統裡,數據取得不可能完整,甚至不是一個封閉的系統。比如我剛剛舉這個例子,我們該不該買LinkedIn,我們想買別人也想買,別人想買的時候,標的的價錢就上去了。你們報考的時候也如此。還有該跟誰結婚,該跟誰求婚,大部分的人一輩子只做一次。這樣的決定讓AI做,我想在很長一段時間,是不可行的。

我覺得大部分人也不會交給系統做。但是,不代表AI不能幫助我們,因為AI會給你很多數據,我覺得有很多人會去看一下,參考一下。包括在決定要不要去收購LinkedIn時候,我們會做很多數據分析,但是最後是人來做這個決定.這就是我講的AI+HI。如果不是一個重複性的任務,你讓AI去做的價值值得商榷。同時,也不是一個封閉系統,更不要說大數據和推理了。

我們不太可能做黑箱的思考,而是要做白箱的思考。人的思考一定是一些有規則的,比如種什麼因得什麼果。這不同於現在的AI系統。現在的AI系統是一個黑箱,不知道里面怎麼運作,然後黑箱與黑箱之間的關係也不清楚。除非一個黑箱的輸出剛好是下一個黑箱的輸入。如果你知道某一個事情的因果關係,就可以做這些事情。

因果關係在統計學裡面是非常難的。統計學裡常常舉一個例子,以前大家認為喜歡玩電遊,與暴力傾向有很大的相關性。如果學過統計學,學過機器學習就會知道,這是完全不科學的。當A與B的相關度很大,但是到底是A影響B,還是B影響A?可能是倒過來,可能有個小孩本身就很暴力,它就比較喜歡玩電遊。如果不是封閉系統的話,因果關係是完全沒有意義的。所以我提到的一個概念——AI與HI的組合。Analysis與decision可以做黑箱。科學上,我們常說大膽假設小心求證。其實多年比薩斜塔的實驗就是蒐集數據來證實想法,就是一個AI加HI。人永遠在Loop裡面。

這裡跟大家介紹微軟的一個產品叫Power BI,大數據可視化。大家會說為什麼可視化這麼重要?因為數據是死的,可視化可以讓你有一個界面,從不同的角度去看,去洞察他的insight。在洞察了因果關係之後,再去找新的數據來證明你的想法。下面我想跟大家舉個例子。

這是真實的數據,關於過去七八十年來人類遭到鯊魚攻擊的數據。在這些數據中,微軟的工具可以自動發現一些有趣的點,大約有上千甚至上萬。不見得所有的點都有意義,同時解讀每一個點,都需要AI與HI的配合。系統會智能推薦有興趣的點,裡面的insight還是需要自己去判斷,這就是我們推出的quick insight。通常界面上有兩種,一種是push,UI界面怎麼將上千上萬的東西分類推給用戶,現在人能否用自然語言對話的方式去pull,去拿人們想用的數據,我們就做了一個東西叫Anna talk。

大家剛看到的是用自然語言的方式,各取所需。當年說了一個詞dangerous,機器不知道這個名詞什麼意思,用戶可以定義,dangerous是死亡多少人。之後,機器不僅知道dangerousyear,還知道dangerousactivity。

為什麼如今AI這麼熱,因為有了數據、算法,可以做很多數字轉型。而且這種數字轉型,對每個人和社會,都會產生很大影響。至少數據轉型會在四大塊對於未來產生深遠影響:

首先,用剛才講的Loop,產生產品迭代,這其實就是互聯網思維;

其次,就算產品不改變,如何優化公司與客戶的聯繫,調動客戶;

再次,是公司運營,如何讓運營變得更有效率,更節約成本;

最後,是人才,如何用大數據讓員工的生活更順暢、和諧,同時還可以激發員工的潛力和創造。

這四塊適用於每個公司,也是業界看到的機會。從架構上看,類似於雲計算的IaaS。其中包括硬件(GPU、FPGA等)、軟件(深度學習框架等),我們提到的認知服務就是一個PaaS。

現在新興的叫Data tasks,在座的很多畢業以後做Data tasks工作,或者做開發者,開發者要用一些SaaS,也要用一些PaaS,SaaS裡面重複性很複雜的東西,有閉環可以用AI搞定。有一些東西是人跟機器一起做的,就是AI+HI這是不同的SaaS,這是可以做的一個簡圖,機會是無窮的,我剛才講的針對每個公司每個單位有四大塊都可以做這些改進。

在微軟的話,大家看到我們新一任CEO到今天,最近大家看到的微軟都是很快的,因為我們在這裡面都講到了先機,這麼多東西用我們的產品和服務做數字化轉型。微軟是一個軟件公司,但是微軟最近硬起來了,網上很多人說,微軟的硬件做的比蘋果還好。

新的硬件HoloLens,我們絕對是領先的,HoloLens已經宣佈今年就會在中國上。還有想Surface studio等等,這些才是未來的東西,很多東西只有我們有。講了那麼多AR、MR我們快賣了一年半了,給大家看一個例子。

這就是那個電梯公司——蒂森克虜伯,在講維修,這相當於在做訓練,訓練這些維修的工人,就是在他辦公室裡就可以看到電梯裡面的結構,這是訓練,還有因為這些都要動,他不可能這時候還在翻它的指南,而且大家可以看到以前電梯維修的記錄。而且還可以知道電梯裡面的結構該從哪裡拆進去。

我講一個簡單的例子,大家看的很清楚,AI的確讓一些職場工作產生了變化,大家不要想的那麼簡單,全部都被取代,很多時候大家都講機器人,其實更重要的是AI+HI,怎麼樣讓技術幫助人更有效能,工作上可以很簡單的看出來,對於一樣的修復工作非常有效率,非常輕鬆的,在沒有壓力的情況下利用技術配合起來把事情做的更好。

基本上我給大家看的AI,特別是相應的大數據、物聯網技術結合以後可以做這些東西。

我現在講講未來,未來會怎麼樣?當然AI報道非常多,對AI的報道里面有很多是危言聳聽或者聽起來很嚇人的。到底哪一些該害怕哪一些不該害怕的。

首先1950年是二戰剛剛結束沒多久的時代,二戰結束剛5年,當年全世界的計算機可以用兩隻手數出來,絕對不超過10臺,但那個時候時代雜誌就已經在擔心造出一個機器比人聰明,1950年我們原子彈都造出來了,原子彈的威力大家也看到了,我們造了很多拖拉機、飛機各個東西,但對那些都不太害怕。

其實我很害怕,因為工作的原因我看過無數多的機器人,有時候不小心手這樣一揮就會被打到,人型機器人站的很穩是非常重的,我站在那邊不小心他碰到我怎麼辦,我一直都很害怕,我這個人比較瘦小,我看到那些大型動物都很害怕。我覺得人類很好玩,大部分人不害怕,人就很擔心機器比我們聰明,那個時候AI還沒有影呢,1950年AI這個詞還沒有出來,AI去年60年,是1956年達特茅斯會議時提出的。說到這個我講講我跟這個的淵源,1956年的時候一個人叫John McCarthy,我很有榮幸,我可以叫他師祖,他帶了一幫人在達特茅斯開了一個會定義了AI兩個字,這也是之所以人家說他是AI之父。我的老師也拿過圖靈獎,他的老師就是JohnMcCarthy,也拿了圖靈獎,所以我算是John McCarthy的正宗徒孫。1956年AI的詞還沒有,大家都已經很害怕了,就跟今天一樣,人在智力這個事情特別受創傷的感覺一直都有。

下面講一下,什麼是智能。其實人對智能的定義一直在改變,感知就是說能夠聽,能夠看。感知之下還有一些東西,今天大家都不覺得很智能的東西,今天講人臉識別大家覺得很智能,能夠聽懂語音也很智能,能夠跟人聊天都是很智能。但是今天有沒有人認為計算是智能,在座沒有人認為算術可以算的很快,很準,你會覺得這個人很快,但是你不會說他很智能。

我這一輩子受到的第一次打擊就是我小學一年級的時候,沒有選上參加珠算隊,現在的年輕人有沒有人真正摸過算盤,用算盤計算過?在我們那個年代計算是跟下棋一樣分級分段的,最早也是到九段,有人可以心算,算的很準,當時我們認為是神童。一年級的時候老師跟我說你蠻聰明的,但是身體不好,別參加珠算隊,當時我很沮喪,但今天跟計算機比計算簡直是以卵擊石。

其實記憶力,以前我們講詩詞倒背如流就是記憶,記憶這個東西大部分人也不會認為是聰明,就像電話號碼,今天我一個電話號碼都記不出來,有手機誰記電話號碼?所以記憶力這件事情不錯,但是沒有人認為多了不起,尤其是涉及到安全,大家記不記得IBM幾年前打敗了所謂的世界冠軍,那個遊戲大部分都是靠記憶,問一些歷史或者地理問題都可以答出來,但那個都還沒有達到今天我講的層次。

人類對智力的定義是不斷在改變的,這是我要講的一點。我這一代已經經歷了,這是人類智能和人工智能共進化,如果我沒有做人工智能,假如說今天沒有人工智能,沒有計算機,我們一定認為一個人很會做心算的很聰明。

我們剛才講Perception感知,感知AI可以做的比人好。我舉個例子,今天假設說北京有50個危險的恐怖分子,給你50張照片,今天你的tasks就記好這50個人長什麼樣,你站在關口那邊看,我可以保證,機器會做的比你好,但是我也保證機器做這個事情你會非常高興,安檢機器做會比我們做的好很多,我們也不會受到傷害。今天讓你拿30個電話號碼記,機器都不用做AI,做一個比較就可以了,人幹嗎要去做這個呢?這個太Low了,這個東西就讓機器去做,這個不是說沒有智能。

既使是這樣,機器去做,你有沒有發現哪一個AI系統跟人做的一樣?今天沒有,明天也沒有。所有系統哪怕是再強,99%點多,有的東西還沒有達到99%,這個是Perception。到了這個level叫做認知,認知這件事情目前為止還是沒有譜的。

今天的AI是一個黑箱,黑箱的問題就在這裡,黑箱的問題它可以知道這是狗,他可以知道可以這樣做,但是他不知道Why,下棋可以打敗李世石,但是他不知道Why。不同的黑箱之間無法做交流,其實還是一個像Perception的問題,但是人是靠認知去做的。

舉個例子,第一個例子我本行是做語音的,語音識別有一個東西叫雞尾酒效應,我們平常到了很噪雜的環境,像雞尾酒會,每個人都要講話,這個也講那個也講,有的時候你一個耳朵要聽好幾個,有人講中文,有人講日文,有人講法文,你聽的都是斷斷續續的,很多音都沒有聽到,但是你還是可以跟這些人溝通。因為雞尾酒會裡面有認識的人,你知道他為什麼來這裡,你知道他大概講什麼,你聽到他幾個音就可以猜出來他大概講這個,人是用認知的方法去做感知,如果把這個東西給今天任何一個AI系統,那做出來就全是錯的。不知道他講什麼基本上不可能辨認。

另外一個例子叫做翻譯,很多做同傳的人問我說,現在翻譯要失去工作了,是不是事實?我說看哪一種翻譯。今天大家用過自動的翻譯都是一句一句翻譯的,常常是詞不達意。沒有一個人一句一句翻的,做翻譯的人都聽了一段才來翻的,常常一整段只翻成一兩句,因為人把內容徹底瞭解了再用自己的話講出來。我自己親身經驗,我有美國的老闆來這裡的時候,因為我工作常常要帶他們見政府官員籤一些合作合同,這時候我就要充當翻譯。我自己知道我怎麼翻,他講了一段我來翻,再講一段我來翻。常常發生什麼事情呢?我老闆還沒講的話我先翻了,這原因非常簡單,這個會議是我安排的,安排領導人見面不要有意外,會談論什麼要先做功課。很多時候,他講了一大堆,有些內容我就先講了。還有幾次先翻了被老闆抓到說,我好像還沒有講,你怎麼先翻了,這就說明我們人可以做到未卜先知。人怎麼做到這件事情,他有些話還沒講,人怎麼知道的?人的認知絕對不是黑箱的,一定有一個白箱,裡面因果關係都很知道,有時候他只要提一個東西我都知道結果。有時候人家說你們真有默契,我皺一個眉頭你都知道怎麼翻了,這絕對可以的,這絕對不是黑箱,黑箱這個人皺眉頭你翻出來,這不太可能的。

所以人的認知一定要做因果很清楚,我今天來這裡,這個領導是誰,講了什麼話,有什麼因,有什麼果,有時候老闆講的話不得體就不要翻了,或者翻譯成好了,這樣才會有和諧社會。而且因為有白箱才可能舉一反三,我自己有小孩,你訓練他認識這是狗這是貓,這是長頸鹿,看三個狗五個狗之後,你再給他看不同的狗他絕對可以辨認出來這是狗,但機器學習肯定要看幾百萬只狗,當然各有優缺點,我們常常講很傳神的一件事情,這個人燒成灰我都認得,就是說一個人你想要記住他,這個人他跟你有關係,不管你的朋友還是敵人燒成灰你都認得,這個東西機器人做不了,一個人去偽裝,機器就識別不了。但是我剛剛講了就50個人陌生人叫你記得辨認,你根本不可能做好。這就是不同的工作,我覺得人和機器適合做的不同的工作。

我講這些東西很多都是我學習的,不是我發明的,所以我覺得做學問真的應該看一看以前的人做什麼,甚至於不同的領域的。有一個哲學家叫John Searle1980年提出來一個概念,我給大家看一段視頻。

這個人是一個腦科學家和哲學家,大家真的要佩服前人的智慧,1980年我剛開始學AI,在座的可能都沒有出生,這裡面有幾個重要的點,圖靈測試就是一個黑箱測試,基本上就是有的機器,有的人你分不出來。他做了一個實驗叫中文房間,為什麼叫中文房間,1980年大家對中國是不瞭解的,一個對漢語一竅不通,只說英語的人關在一間只有一個開口的封閉房間中。房間裡有一本用英文寫成的手冊,指示該如何處理收到的漢語訊息及如何以漢語相應地回覆。房外的人不斷向房間內遞進用中文寫成的問題。房內的人便按照手冊的說明,查找到合適的指示,將相應的中文字符組合成對問題的解答,並將答案遞出房間。儘管房裡的人可以以假亂真,讓房外的人以為他確確實實說漢語,但其實他卻壓根不懂漢語。這個東西很像翻譯,當然是一個問答,他說這個黑箱裡面有一個系統,當時就有強AI和弱AI,意思就是說你不瞭解,你黑箱進黑箱出,就算你能答的很漂亮,不代表你有理解,有些情況會有用,有些情況沒用。這種沒有理解的東西不是人做的方式,今天一個人說白痴啊,你會不會講中文,你聽到這個話是很生氣的,你不會說,對,我是白痴,我不會講中文。所以這就是強AI跟弱AI的不同,強AI是人的AI,其實強AI很弱,弱AI很強,這是定義的問題。強AI就是我真正瞭解以後用我的話講出來,用我的話答出來,另外一種就是黑箱,我根本沒有感情的,你罵我也不知道。

今天大家看到AI包括目前的深度學習都是這種,但是很有用,弱AI沒有感情反而很有用,不止我一個人這樣講,事實上客觀是很了不起的事情,人不太容易客觀,人家一罵你心裡面就不爽快,有它的弱處和好處。這個是神經科學家做出來的左右腦,大家可以稍微讀一下,我想大家不意外,當然大腦結構比這個強,但是大家歸納出來右腦管什麼,左腦管什麼,你會發現左腦管一些比較邏輯的,有一些邏輯思考的,然後是在做分析的,右腦是在合成,是一個比較像創意的這些東西在這邊,所以這個是左右腦的差別。

如果看這兩個就會發現,(PPT圖示)這一塊AI做的非常好,很多可能做的都比人強,這一塊可以做一些,但是大家只做到一半,人做的比AI強多了,到了所謂的我現在要講的創造力,AI是完全沒有譜的,AI是完全沒有創造力的,我定義一個創造力就是人最了不起的算法,創造力就是你解一個未解的問題。因為用別人的算法不能叫創新,那叫應用。

在這裡我跟大家解釋什麼叫算法,用一個最簡單的例子,1+到N有兩種算法,一種是運算,另外一種算法是N乘上N加1除以2,這是高斯發明的,當年高斯很聰明常常問數學老師,數學老師不勝其煩,有一天就讓高斯從1到100依次相加求和,本想高斯要花很久才可以做完,沒想到高斯3秒鐘就告訴了他答案,就是N乘上N+1除以2,這是兩種不同的算法,顯然高斯的是一個比較好的算法。

說到這裡我講一講對阿爾法狗的理解,今天你跟計算機比1+N,計算機用比較土的方法,你用聰明的算法,假設這個N很大,計算機算的快,計算機1+到N都比你加的快。任何一件事情是算法+計算。阿爾法狗的比賽算法來自於一群很聰明的人,都是人想出來的,所以算法是人想出來的,阿爾法狗計算是幾萬臺機器在雲端那裡算,李世石很可憐,他有一個算法還要自己計算,下棋是要比時間的,不是可以無窮的。李世石先生如果5場還贏了一場,其他幾場還有希望贏的話,李世石的算法是不是比阿爾法狗的算法更升一籌,否則那是以卵擊石,我們用聰明的算法,計算機用笨的算法,計算機還是贏。

計算那部分本身太不公平了,因為空有算法還要計算,腦子一直在算,所以每一次當所謂什麼東西超過人的時候,大家說AI多厲害,每一次發生這種事情我感覺人怎麼這麼聰明,才讓今天的計算機這麼聰明。而且什麼叫下棋,當年下象棋的時候有點像開根號,大家就看比誰下的深,跟計算機比開根號本身就沒有意義,為什麼要下棋呢,今天講說阿爾法狗是一個黑箱,看到這樣經過大型的數據分析以後,他就覺得應該走這一步比較好,這跟我剛剛講認50個恐怖分子沒有兩樣。所以我就說如果把東西變成這樣的話,去比是沒有任何意義的。

人最大的智慧,有史以來大家公認是愛因斯坦最聰明,去年有一個重要的事情叫做引力波。但是我們整整等了一百多年,用最先進的技術才勉強測到了一些影子所以我們說引力波存在,當一百多年前,愛因斯坦提出這個假說的時候是沒有數據的,不要說是大數據,簡直是0數據。所以人的智慧其實來自於天外飛來一筆的這種東西,這個東西計算機不可能有創造力,而且計算機的程序都是我們植入進去的,所有今天AI的東西都是人研究出來的,沒有計算機可以自己想出新的算法,這是沒有的。

所以人跟計算機的關係又回到我講的AI+HI的關係,人是去想一些大膽假設,然後讓計算機小心求證,更多是這樣的關係。

下面講一下心靈、意識、創造力這三者,這是我跟腦科學家學習過來的,人最了不起的是意識。剛才講的中文房間實際上要有意識的是強人工智能,笛卡兒也說過我思故我在,今天有兩派,有一派人認為所有意識都在腦子裡,除了腦以外就沒有認識。另外一派認為人的意識是全身的。這不可能有結論,大部分人認為是一個全身的問題,原因很簡單。你有疼痛的時候會影響你的意識,或者你哪裡舒暢也會影響你的意識,很難說只有腦,如果只有腦的話,神經這些東西都應該不影響,說到意識,一定是生物才有可能有意識,機器不可能是生物,不會有意識。還有就是生物裡面植物也沒有意識,這是大家的共識,既使動物裡面,普遍人想象只有少數人相信只有少數人有意識,有一個測試拿一個便利貼張貼在你額頭,動物也是貼在額頭,人會知道這不是我的一部分就會摸它,甚至把它拿掉。

做了很多動物實驗,結果很吃驚,大部分動物是沒有感覺便利貼的存在,很多狗都通不過,只有某些狗,據說很多猴子也沒有通過,海豚鯨魚倒是通過。大家可能有爭議,有的動物知道不是他的一部分,但是他就不會摸它,但是無論如何,我要講有意識的動物是很少的。

耶魯大學教授寫了一本書,他把人腦的規律分成兩部分,意識力很集中和意識力不集中的時候,意識力很集中的時候你是計算很準,不會算錯。意識力不集中的時候會做白日夢甚至睡覺的時候常常會算錯,但是那個時候你的創造力有可能特別強,為什麼呢?我也找到很多例子,一個是貝多芬做第九交響曲的時候他是完全聾了也瞎了,還有梵高最後把耳朵割掉以後他很痛苦,痛苦的時候他意識不可能集中的。有一個畫家找到苯的六角形規律的時候,他是在睡夢中夢到一隻蛇咬到自己的尾巴才使他找到苯的,更不要說很多詩人酩酊大醉甚至吃藥,酩酊大醉以後可以做出很有創意的東西,人本身是不完美的,當意識力不集中的時候,往往有很多了不起的創新在那個時候創造出來。

很多人研究為什麼,其實就是說意識力集中的時候你不太可能看到兩個八竿子打不著的關係,比如我在研究苯離子是跟六角形的蛇沒有關係的,當你意識力不集中的時候就看到了關聯性,很有可能了不起的創新就是這麼來的,天外飛來一筆,沒準愛因斯坦睡覺的時候想到了引力波。但是有一點我要講的,有的人說從此以後回去多睡覺,這樣創造性比較高,但是光睡覺是不夠的,光有大膽假設不夠,要小心求證多做實驗,多寫程序。

最後,人工智能到底危不危險?弱AI很強,現在叫大數據,沒有誰能讀特別多的數據,強AI是指人這個也懂一點,那個也懂一點,又能看又能聽等等之類的,但是每一樣都沒有專家系統強。而且人沒有辦法一天24小時集中,人一直也很奇怪,一個人一輩子有1/3的時候是沒有意識的,睡覺的時候沒有意識,但是人的睡覺有可能因為不完美造成我們有創造力。

另外一個就是說,我們到底可不可以造一個機器人有意識,我會覺得造一個機器人有意識在科學上有意義,在實際生活上沒有太大的意義。我時常用一個例子,我叫太太說,親愛的,你幫我弄杯咖啡,10次裡面有5次,我太太會說你自己有手有腳幹嗎不去弄,我說你講的很有道理,我趕快去弄,我造一個機器人10次裡面有一次這麼講,我馬上就把它毀了,你造一個機器人當然希望他有用,就算你想造,其實我們有幾千萬年的經驗教育我們下一代,我們巴不得我們下一代比我們聰明,在座的有小孩的人,你去問他你小孩是不是比你聰明,他說對,我小孩比我聰明。你要造一個有意識的東西多生點小孩就行了,這個命題本身是有問題的,造一個有意識又聰明的東西,在科學上很有意義,在實際上不一定那麼有意義。

奇點會不會到?有人說AI到了一個地步自己可以翻新,問題就可以往前解,最後就把世界變得越來越好。總體角度來看,就算有一天做到了強AI,這也不太可能發生。原因是當你解了一個難題,愛因斯坦很聰明,世界上還有很多未解的問題,數學上雷曼猜想還沒有解。今天大家學計算機的,P等不等於NP,到底等於不等於我們也不知道。再往前走人從哪裡來,宇宙從哪裡來,有沒有大爆炸,將來會不會擴張再縮小?沒有人知道,下一個問題有可能永遠無解,所以不會有奇點。而且如果這個世界上所有東西都被解了,人存在宇宙間的意義有可能就大打折扣,有可能沒有,這個離我們太遠了,唯一大家可能要擔心的是Bug。有人問我哪一部科幻電影比較接近事實,我覺得可能是《駭客帝國》,他是講計算機裡面有一個Bug,Bug代表出它有一些漏洞,但它剛剛好看到人就殺,這個可能性幾乎是0,所以大家也不用擔心。

我還是比較樂觀的,AI除了是Augmented intelligence以外,也可以是Human+ Machine等於Superman,我就講這麼多,謝謝大家!

50

65

相關推薦

推薦中...