【AI峰會】雲知聲CEO黃偉:第三次人工智能高潮和前兩次不一樣!

【AI峰會】雲知聲CEO黃偉:第三次人工智能高潮和前兩次不一樣!

【獵雲網(微信:ilieyun)北京】4月13日報道(文西龍)

今天,獵雲網”2017人工智能產業創業創新峰會”在北京四季酒店隆重召開。此次峰會的主題為“精·識·致·用”,分別詮釋為精準大數據,智能識別,產業結合,生活應用。上百位人工智能領域著名學者、頂級專家和知名投資人蔘與,共同探討當今AI的發展創新與變革,將產業與人們的實際應用相結合,為人工智能的普及奠定可行性的基礎。

雲知聲CEO黃偉發表了關於“人工智能如何促進產業化驅動”的主題演講。在他看來,人工智能一定跟行業需求結合,一定打通數據和應用的閉環,只有這樣數據和技術才能形成雙輪驅動。

而對於人工智能,他表示,“其實人工智能這個概念提出來已經61週年,那麼前兩次為什麼失敗了?當然我們有很多解釋。比如說當年產業環境不成熟,我們沒有數據我們沒有處理能力,我們沒有好的算法”。

但是他認為第三次人工智能的高潮和前兩次不一樣。“一個外在的表現是什麼?過去兩次人工智能的高潮都是學術體系在主導,或者是學術界的集體自嗨。這次不一樣,這次熱潮是工業界引導”。

“有人問我人能不能和機器談戀愛?我覺得我有生之年是不可能的,那種強人工智能,通用人工智能離我們很久遠”。

在黃偉看來,當技術能力達到一個臨界點,意味著顛覆的機會到了。比如說語音識別,語音識別的準確率已經超過人耳,視覺方面,人臉識別也超過了眼睛。“最近幾年,我們在機器翻譯、視覺、語音識別、自然語言理解,幾乎所有的領域取得的突破,比過去二十年三十年都要大”。

【AI峰會】雲知聲CEO黃偉:第三次人工智能高潮和前兩次不一樣!

黃偉在演講

以下是黃偉的演講實錄,內容經獵雲網整理:

人工智能如何促進產業化驅動?其實從AlphaGo這個事兒之後,這個熱潮到今天為止已經一年多,一年期間我們不僅看到行業內部,也看到資本市場甚至大爺大媽都在做人工智能,今天大家一見面,如果嘴巴里沒有一個人工智能這個詞你感覺已經Out了。但是過去一年我們生活發生了什麼改變?好像也沒有什麼。其實人工智能這個概念提出來已經61週年,那麼前兩次為什麼失敗了?當然我們有很多解釋。比如說當年產業環境不成熟,我們沒有數據我們沒有處理能力,我們沒有好的算法。

但是有一個共同特點是什麼?是人工智能在過去的兩次高潮和低谷的時候沒有滿足需求。我們的期望值和現實能力之間是有巨大差別的,市場對能力的期待總是有時間窗口,在一個時間之內達不到,公眾的熱情就會散去,所以我想談的就是,人工智能如果不能落地的話,那就真的是幻影。這一年我們作為從業者如履薄冰、戰戰兢兢,有人問我人能不能和機器談戀愛?我覺得我有生之年是不可能的,那種強人工智能,通用人工智能離我們很久遠。

這張圖簡明扼要的列出了人工智能的要素。第一是大數據,第二是機器學習算法,第三是我們今天擁有的,歷史上不可比擬的計算能力。這三個要素相當於一個火箭飛向太空,需要有燃料,有耐高溫的平臺還有大引擎,三個缺一不可。深度學習出現之前,統計學習壟斷著機器學習這個領域。統計學隨著數據規模的增加,它的性能會有一個飽和度,就是不再增加了。但是深度學習恰恰可以增加,它可以把CPU、GPU以及超算能力非常完美的結合在一起,但是深度學習是一個黑盒子,我們知道它好用但是不知道為什麼好用?我相信深度學習往下走,依然會遇到它的天花板。

前面我潑了冷水,大家覺得人工智能是不是沒有什麼期待?但是第三次人工智能的高潮和前兩次不一樣。一個外在的表現是什麼?過去兩次人工智能的高潮都是學術體系在主導,或者是學術界的集體自嗨。這次不一樣,這次熱潮是工業界引導。比如我們參加,無論是視覺、音頻的國際學術會議,你會發現最好的講解者都是來自谷歌、亞馬遜頂尖的工業界。今天看到谷歌研發TPU,英偉達的股價翻了好幾倍。那麼芯片的目的就是用標準化的,非常低成本的方式來滿足需求,所以這是和前兩次非常大的不同。

那麼之所以不同是因為深度學習、增強學習這些新技術出現,再結合互聯網、IOT能夠讓我們獲得海量數據,使得我們在機器翻譯、視覺、語音識別、自然語言理解,幾乎所有的領域裡面我們可能最近幾年取得的突破,比過去二十年三十年都要大。比如說語音識別,語音識別的準確率已經超過人耳,視覺方面,人臉識別也超過了眼睛。那麼當技術能力達到一個臨界點,意味著顛覆的機會到了。

所以我們可以看到在很多領域,比如識別、醫療、券商、互聯網大數據、教育、銀行保險等各個領域,其實機器學習不是說簡單的提高效率,我們甚至可以改變整個行業。我們一般會需要速記,但是以後不需要了,因為今天的講話會實時生成文字,那麼意味著速記這個行業被顛覆了。還有很多領域,比如把機器學習用在金融和投資方面,它可能取得比我們交易員更好的一個交易結果。

這個圖是過去61年裡麵人工智能的發展,一個大的脈絡圖,我們可以看到前兩次的高潮、寒冬、高潮、寒冬,其實一個很有意思的事情是什麼?我們今天都知道深度學習有一個大神,就是Hinton教授。我想說一點,我們雲知聲在2012年12月底的時候,我們把基於深度學習的引擎上線,做了第一個插件,上線一週激活用戶超過五萬,可能很多用戶當年用過深度學習,你們感覺到了嗎?沒有。到AlphaGo事件之後我們看到很多大學很多機構都在說深度學習,其實深度學習對我們的改變,就是從2006年Hinton教授開始做深度學習,微軟第一次把深度學習用在工業領域裡,我們還是領先的,我們2012年把深度學習工業化上線。直到今天深度學習幾乎改變我們所有行業。

前面聽了幾個嘉賓的講話,我今天用一些話跟大家講,我希望今天讓大家明白什麼是人工智能?什麼是感知認知和表達決策。什麼感知?圖像識別是把圖像IP化。認知,比如自然語言,還有決策、推理,這些都是和人的思維接近,但是又很難做的。還有一點是表達,我們用例子來舉例。比如語音識別,感知就是從識別開始的。認知就是我來理解你文字裡面到底什麼意思?表達是什麼?我通過推理讓機器自己組織語言然後把這個表達出來。

視覺方面是什麼?比如攝像頭我監控這個區域,我通過感知技術來識別每個人的面孔,然後把它ID化,如果ID跟黑名單匹配,那麼說明這個人是一個嫌疑犯,這時候表達是什麼?公安局來抓人,這就是表達,其實就是這麼一個過程。當然這裡包含的點非常非常多。這是我們在過去幾年裡面我們的技術框架的大概進展,我們剛成立之後我們第一代版本我們用的並不是深度學習,是統計學習。就是非常傳統的統計學習,當時我們比較好的一點是我們幾乎當時在國內,基於統計我們把性能做好極致,我們用友商四分之一過程五分之一的數據量,達到比對方更好的性能指標。統計學習是一個環節一個環節套一起,我學生時代就是做語音識別,所以以前的經驗起了很多幫助。深度學習就是你有數據有GPU,可以得到很好的數據。

我們當時在國內應該是領先這個行業,基本上國內領先這個行業,我們率先發出一個基於深度學習的引擎。今天我們已經3.0版本,不光是感知層面而且是認知層面,識別精度、識別速度都比過去有非常大的提升。這是算法層面,另外就是計算能力。其實技術的PK,某種意義也是一個競賽。你不可能指望一個團隊用非常少的數據非常少的計算單元能得到和巨頭能夠匹配的性能,這是不可能的。所以說在過去五年裡,其實我們不光在算法方面,在優化迭代和超算能力,在數據量方面做了很多儲備。比如說在2015年我們發佈了我們的操作平臺,在當時那個時間我們鏈接接近兩百個GPU,這個數量級可以跟國內行業巨頭去PK的,去年9月份我們發佈了分佈式操作系統,一個是硬件一個是軟件,可以非常好的結合在一起。

另外一點是作為一家創業公司,我們很早意識到數據的價值,公司成立三個月我們發佈完全免費的開放語音平臺。到今天雲知聲的語音雲服務已經接入超過一億臺設備,這個為雲知聲往後面的發展做了非常好的數據方面的儲備。那麼人工智能和商業是良性循環,人工智能一定跟行業需求結合,一定打通數據和應用的閉環,只有這樣數據和技術才能形成雙輪驅動。這是為什麼我們先從行業切入的主要原因。

人工智能其實是一個很炫的東西,很虛,它是一種能力,是一種賦能,和行業結合,它一定需要一個載體。我們當時在國內提出雲端芯的概念,今天看到幾乎所有大公司小公司都接觸這種概念都這麼做,我們通過一種芯片的能力提供給大家。這是我們的商業邏輯,一縱一橫,一縱就是我們一定在一個領域裡面,從技術層面,無論是雲端服務、終端服務還是芯片,從軟件到硬件打通,形成技術壁壘。一橫,我們希望把準化的技術和服務能夠同時覆蓋若干領域。今天我們主要是兩大方向,一個是智慧生活一個是智慧服務。智慧生活我們是以智能家居、車載為主,智慧服務是以教育、醫療為主。

這是過去一兩年我們取得商業上面的進展,我們知道亞馬遜的Echo讓大家瞭解這是未來一個標準化的形態。我們看到很多故事但很少看到落地,今天我們在國內做到,這些都是量產車沒有是概念車。這是從去年開始我們和格力、美的,國內所有的家電巨頭,在今年所有廠商都拿到雲知聲的產品,這些都是已經量產的設備。類似這樣的產品我們做了一個方案把它提供給廠商,你可以認為每個空調設備都是這樣的,去年一個技術出貨量就是20萬臺。

右邊是我們從2014年底我們做車載,我們開始切入後方車載,車載就是AI服務+AI UI,在後端雲知聲的方案有接近70%的市場份額。下面可以看一下兩個視頻。

(播放視頻)

第一段是空調控制,大家看到很簡單,但是實際上很難。為什麼很難?因為剛才類似於Echo的識別,只是用現有的芯片,這是今天在工業界的最高標準。後面是類似Echo,比如多輪對話、打斷對話。我再強調一下AI和產業結合,成本是你必須考慮的問題。比如做一個特別複雜的雲端系統,我只要拼數據拼資源,這是比較容易做到的。但是有限資源的情況下面達到這樣的效果是必須難的。

另外是智慧生活,我們首先從醫療切入。我們去年和協和醫院我們把語音技術應用在醫院的病歷錄入裡面,很多人不知道這個東西怎麼用?我們可以看一下使用場景。

(播放視頻)

可以看到醫院裡面醫生的工作環境比較惡劣,一個房間裡面很多醫生還有病人。第二個,如果我們見過會議記要系統,說的都是人話,但是醫生講的都是大量專業名詞,這是非常難的。目前為止雲知聲是國內唯一一家把語音系統在醫療行業裡面實際落地,今天我們從去年7月份之後,我們目前在國內已經落地了30多家三甲醫院,今年國內有一百多家醫院使用雲知聲的系統。這個系統第一極大的提升醫生效率,使得協和醫院病人錄入時間從三個小時節約到一個小時之內。

我們以前很多是用複製的方式,但是這樣會產生大量的錯誤,有80%是來自拷貝。我們講醫療大數據,哪兒來的數據?一個醫院今天有一萬病人,9800都是複製過來的,我們有大數據嗎?沒有,但是通過這種方式我們每天可以產生大量的真實數據。協和醫院已經全面部署,大家可以看到很多科室協和醫院用這種方式給大家錄病歷了。

我們怎麼用技術和行業結合,讓社會看到人工智能的威力,另外一點通過技術和商業結合,使得數據和技術之間能夠形成一個正向反饋。今天我們每天可以源源不斷的獲得大量醫學上面的數據,一方面使得雲知聲在這個領域技術門檻越來越高,另外一方面使我們可以給用戶提供更好的服務。

我們今天做的所有工作我們使得每個設備變得更加智能化,類似我們從09、2010年我們將功能機向智能機過渡,但這個單機智能到最後一定會過渡到點滴智能,每個設備有感知能力有認知能力,而且設備之間有互相學習能力,只有這樣才是真正的萬物互聯。這是今天我們從業者我們努力的方向我們想做的事情,我覺得這些方向如果我們真的能夠,不是在雲端我們每天去講故事,而是我們真正把它落地,這個方面我們可以腳踏實地的往下走。這就是我的分享,謝謝大家!

本文來自獵雲網,如若轉載,請註明出處:http://www.lieyunwang.com/archives/297777

相關推薦

推薦中...