科大訊飛王士進:第三代人機交互時代來臨

DoNews 2017-04-28

DoNews4月27日消息(記者 翟繼茹)在GMIC北京2017大會上,科大訊飛研究院副院長王士進發表了《以人工智能技術為基礎構建商業新生態》的主題演講。王士進認為要做到人工智能+需要對各個行業進行透徹的理解,並擁有大量的優質數據。

王士進介紹第一代人機交互是以鍵盤和鼠標為主,隨著移動互聯網到來,觸控成為第二代人機交互方式。在物聯網時代,以智能語音為主,視覺、觸摸為輔的智能交互將很快走入我們的生活。

王士進表示在基於新一代人機交互基礎上來構建商業新生態方面,科大訊飛已經在包括家居、醫療、安防、教育等場景下都做了佈局。

人工智能+是近兩年非常火熱的話題,王士進認為它包含了兩層意思,第一層是以語音、視覺為主的AI技術在萬物互聯的場景下面使人機交互效果更加優異。第二個層面的意義是機器學習正在成為行業專家,這使得各領域都掀起了人工智能與行業結合的熱潮。(完)

以下為演講實錄:

大家好,因為剛才主持人介紹了,我不用介紹我們公司了,來自科大訊飛,談談商業新生態構建,正好剛才我們有一個環節也討論了人工智能技術在很多商業裡面怎麼應用,怎麼去體現。

所以我今天PPT會分成兩個部分,第一個部分用非常短的時間把所謂的人工智能技術簡單過一遍。講到人工智能大家比較清楚,我們在1956年在美國會議上有幾位年輕的,當然是非常有名的幾個專家提出人工智能技術,所謂人工智能有很多不同的定義,但是在這些定義裡面的話有一些大家的共識,這些共識包括我們認為機器可以像人一樣感知、認知,去決策和執行,大家聽到很多嘉賓講的這些關於智能的一些相關工作,其實都涉及到這樣一些東西。所以我們可以把在自然宇宙中,人類智能和我們在數字宇宙中人工智能技術對應起來。

關於人工智能分類的話,科大訊飛最早提出分類方式,第一是運算技能,能存會算,第二包括感知和運動智能,希望機器像人一樣可以感知外面的世界。還有一個是認知智能,是我們認為人工智能比較高的境界,是讓我們機器可以理解會思考。

關於運算智能,前面的人也講了很多,實際上大家可以看到關於在存儲和運算上面,其實機器已經把我們人類拋在後面了,無論α狗還是IBM那位先生提到很多計算,機器所實現的效果比人類好很多了。感知的話,大家提到很多,包括我們人類的聽覺,包括人類的視覺,機器在很多方面進步非常快,特別是我們從2010年開始起深度學習提出來之後,機器感知的技能越來越快,甚至很多領域已經達到和超過人類。

在第二段的話就是運動智能,也是一樣的,機器怎麼能夠通過運動的判斷達到人的效果,比較有名在去年還是前年有機器人跟德國著名的乒乓球進行比賽,雖然人類最後轉敗為勝,但是大家可以看到機器做了很多優化的工作。

關於認知智能我們說這是人類智能最高的體現,這裡麵包含很多東西,對語言理解,對邏輯的推理,大家認為是機器最大的挑戰,同時這裡面也是蘊含了更多的商業機會。前面把人工智能技術過了一遍,下面談談技術和產業的融合,在談融合之前,我們簡單看人工智能的三次浪潮,時間有限,我不對每次浪潮做具體的解釋了,大家可以看到從現在開始,2000年開始,10年以後的話我們認為核心技術,跟這種產業形成的深度融合,很多嘉賓提到了大家都認為現在是人工智能爆發非常好的時機。

訊飛在2014年的時候基於很多研究成果提出超腦,提出幾個主要的功能,我們希望訊飛超腦能聽會說,能理解,訊飛做雲起家,雲識別上,包括產業裡面做了很多工作,最近我們在去年參加了由谷歌組織的比賽,因為大家知道在最近在ROT的時代,很多領域基於更困難的場景裡面怎麼使用多麥克風促進雲識別的效果,這一直是產業裡面最重要的問題,這也是以麥克風陣列識別技術。相比於國內和國際很多企業,我們做了很多優化,所以大家看效果也還不錯。

第二個是讓機器會說,會說我們主要講機器合成,從06年開始參加國際語音合成的比賽,到16年已經是11屆了,訊飛第一能夠連續蟬聯11屆的冠軍,第二是唯一一家能夠把自然度做上4分的單位,我們業內評測5分滿分,4分我們認為接近播音主持戰或者正常人的水平。特別隨著深度學習的發展,訊飛在去年年底的時候發佈了一項新的合成技術,使得我們這個合成技術只需要半個小時左右的錄音,任何一個說話人我們就可以達到合成,讓你從聽感上很難區分出機器還是人這樣一個效果。

關於讓機器能理解的話,訊飛提出超腦以後也做了很多工作,比如參加知識圖譜的構建比賽,訊飛取得第一名的效果。我們去年還參加由美國舉行的一個比賽,我們認為它是邏輯推理非常重要的比賽,大家認為這是替代圖林測試非常有可能的。雖然說訊飛在裡面比賽成績比較好,大家看到機器還有很多提升空間,比如人類在系統上可以做90分以上,當時比賽可以做到60分,現在可以做到70多分。

最近在機器閱讀理解這個領域上面的話,國際上和國內有非常多科研單位做類似的工作,訊飛也在競爭激烈中能夠持續保持這個技術的領先。剛才在實驗室也提到,我們說衡量機器設備有沒有智能有一個辦法,其中一個參加考試,考試這塊原來在美國實驗室做了一個美國生物考試,日本有一個東京大學的機器人,中國在15年的時候也提出由科技部發起,由科大訊飛主導首箇中國人工智能的,我們是希望積極人可以像人一樣進行語言的理解,聯想的推理,知識的表示和自主學習,同時說的話讓機器人蔘加我們的高考,也能夠考上大學,還希望是一本。

眾所周知,最近一兩年非常重要的話題,人工智能+,科大訊飛或者我,我認為包含兩層意思,第一層我們認為人工智能的技術,特別是語音、視覺等使我們在萬物互聯的場景下面,使得我們機器和人進行更好、更自然的交互,這是一個。

第二個深入到各個領域,機器可以學習到這些領域裡面專家的知識,從而變成可預測、可決策這樣一些模型,從而達到接近領域專家的水平。同時大家看到各行各業都在掀起了人工智能和這些行業結合的工作。

下面我分別把這兩大塊做一些介紹。我們在早期的時候,第一代人和機器交互是以鍵盤和鼠標為主,我們最早的時候小型機的時代,一直到個人PC的時代,主要通過鍵盤和鼠標和機器交互,隨著我們說觸摸屏,互聯網時代到來的話,更多的時候,大家用跟手機,跟平板做交流的時候的話,更多做多點觸控這種方式和機器做交流,隨著IOT時代到來的話,智能時代以語音為主,包括視覺,包括觸摸這些為輔這樣一種智能交互時代,我們認為是第三代,而且會越來越快進入到我們的生活。

在這裡訊飛15年的時候提出AI、UI人工智能時代的這種人機交互解決方案,並且我們持續在為之優化。主要解決這種人機交互裡面的五個痛點問題,第一個原廠和降噪,很多語音識別距離話筒比較近或者噪聲很小的時候識別很好,但是出現距離遠或者噪聲大比較難,智能家居有各種噪聲和迴響怎麼做好,這個很關鍵。第二個有些人有方言,或者方言味會比普通味還要重,這種場景下怎麼做好,這是第二個痛點。第三個就是我們原來很多機器人人和機交互的話,術語說單攻,你說話的時候他要等,人和人交互不是這樣的,是一個非常自然的交互形式,所以我們也做了很多關於人機進行雙攻交互的。

第四個我們知道語音識別是一個基於概率統計體系的,概率統計體系裡面一定會有錯誤產生,錯誤對理解會造成困難,結合很多領域的知識把語音識別做識別結果的一些校正或者順滑,使得人機交互更流暢。還有多輪交互,變成以機器為中心變成以人為中心,就是機器面向人要解決的具體任務,以任務為中心看機器怎麼通過多次交流,使得達到人要完成的事情。

這個技術的話訊飛語音雲已經開放很長時間了,16年2月份左右上線的話,大家看到我們在一年左右時間因為這些技術和平臺以及解決方案的上線,使得用戶包括交互次數有些非常大的變化。

第二部分是講我們人工智能技術和各個行業結合,給各個行業帶來的變化,比如說剛才提到我們使用人工智能技術和我們這種交流的場景,比如大家可以看到在很多會議場景裡面,原來會議場景有一個最重要的東西就是記者怎麼整理成稿是一個很困難的事情,現在會非常容易,而且特別是我們在面向具體,我們是演講,面向會議的話,它可以識別出我們說話人的身份,使得在整理成稿的時候更加容易辨認說話人。

第二個,我們會發現在很多場景裡面,交流的時候需要進行語音的同傳,原來會有非常大的麻煩,不同的領域或者不同場景要請不同的同傳,因為同傳如果對這個具體的領域不太熟悉的話翻譯出來的效果也不太好,所以基於機器翻譯的效果的話,基於交流的時候可以迅速去捕捉到大概的意思,去方便交流。

第二個的話基於移動互聯網手機的應用,包括跟移動合作,提出靈犀這個品牌,定義人機交互智能助理,通過跟軟件的交互,都可以完成。第二個是訊飛語音輸入法,原來很多時候輸入有拼音,有手寫等很多輸入方式,但是很多場景裡面現在用語音輸入發現很多人願意使用,並且它的輸入速度相比以前用拼音或者用手寫有一個非常大的提升。

第三個我們說在智能家居里面使用的話,會使得交互非常容易。這一點訊飛在2015年左右發佈智能家居的各種解決方案,包括音箱,還有和家電的合作,這是16年也是非常熱的話題,包括谷歌、蘋果、亞馬遜都發布了自己智能家居解決方案,這塊也是非常有意思的話題。

車載裡面人機交互也是非常有意思的話題,手不能離開駕駛的時候使用語音交互是非常重要的方式,大家知道從另外一點上說,在車載環境裡面的話,語音識別是非常困難的,因為噪聲會比通常噪聲會難很多,訊飛在2015年和2016年連續參加由寶馬、奔馳、通用等公司語音技術評測,並且在評測裡面都取得第一名的成績,將來我們陸續無論在國際車場還是國內車場陸續包含這樣的車機會陸陸續續上線。

關於人工智能和各個行業結合的話,大家可以看到,首先懂得這個行業,並且能夠獲得這個行業大的數據,同時我們利用人工智能的核心算法,以及雲平臺能力,使得能夠給這些行業進行賦能。比如+教育,教育人最常見的難點和痛點是怎麼根據學生去給他因材施教,因為我們知道在一個課堂裡面,老師是沒有辦法對每個學生去個性化的學習和輔導,這塊機器去對每個學生進行畫像,根據智能算法對他進行推薦和學習,從而使得教育會有更深刻的變革。

人工智能和智慧城市的結合,包括剛才提到智能安防,包括社管雲的服務,我們在一個城市的合作裡面的話,通過大數據+人工智能計劃的話,無論辦事效率還是辦事人員有一個非常大的變化。

剛才我看也提到智能醫療,我們也做了很多工作,包括我們說醫生在病例生成的時候用語音錄入病例,第二基於先進的圖象識別技術做各種疾病的判別,特別癌症一些病的判別,同時還在做輔助診療的技術,基於病人的一些長期病例或者歷史去做各種輔助,同時我們應該會參加今年的職業醫生水平的考試,醫考的機器人應該是在七八月份上線,對病人怎麼診斷,怎麼醫療的話,可能要做跟多工作。

訊飛在很多行業裡面也做了很多應用,因為時間有限,我大概舉這樣一些例子是拋磚引玉,我們自己給自己定的是希望在中國用人工智能改變生活,改變世界。謝謝大家。

相關推薦

推薦中...