目前人工智能研究方向有哪些?

具體有哪些成果了?目前人工智能研究方向有哪些?
2 個回答
大比特商务网
2017-09-26

專訪微軟沈向洋:感知和認知是人工智能研究方向

目前人工智能研究方向有哪些?微軟執行副總裁沈向洋在主題演講闡述人工智能

  在西雅圖開幕的Build全球開發者大會上,微軟首次沒有在首日主題演講提到Windows,將最重要的位置留給了雲服務和人工智能。微軟CEO薩提亞·納德拉(Satya Nadella)更明確提出,微軟要用人工智能重新定義微軟的所有業務。

如果說人工智能是貫穿未來微軟所有業務的血液,那麼領導微軟未來核心競爭力的重任就落在了微軟全球執行副總裁、人工智能及研究事業部負責人沈向洋的肩上。大會首日的主題演講,正是由沈向洋來最後進行壓軸技術展示。

在主題演講之後,沈向洋接受了包括新浪科技在內的中國媒體群訪。雖然已經在臺上演說了將近一個小時,但在近一個小時的採訪過程中,沈向洋一直站著侃侃而談。談到人工智能未來發展的時候,這位美國科技巨頭公司職位最高的華人臉上掛著一種自然的興奮。

AI重新定義微軟

談到如何具體實施“人工智能重新定義微軟業務”時,沈向洋表示,微軟所有的產品都必須要人工智能化。舉例來說,所有的Office產品都正在進行人工智能化,很多技術都還是剛剛開始。Powerpoint不僅加入了自動翻譯功能,還添加了圖片自動說明的功能。Word裡面也使用了人工智能技術,其中最激動人心的技術就是機器閱讀。

他介紹稱,微軟剛剛收購了一家加拿大人工智能創業公司Maluuba,後者就是用自然語言和深度學習的方法來做機器閱讀功能。這方面的技術會給Office帶來巨大的影響。目前微軟人工智能部門和Office部門正在密切協作。

而在微軟的轉型重點雲服務,微軟在努力用人工智能的雲幫助企業用戶,其中包括Azure雲服務中的認知服務,這會是Azure未來的重中之重。而Windows部門和Hololens也加入了很多計算機視覺和計算機語音方面的人工智能技術。

對話交互AI是方向

對話交互人工智能(Conversational AI)的概念是過去一年各大人工智能公司都在推崇的概念。沈向洋介紹稱,計算機最早是指令界面,後來是圖形交互界面,但這些還是需要人類學習計算機的語言。到了對話交互人工智能的階段,則是計算機來學習人類的語言。

但他強調,目前對話交互人工智能的產品研發還處在早期階段,還遠遠沒有達到通過對話實現人機交互。微軟的Cortana和蘋果的Siri都還是計算機根據人類指令完成一些任務。

沈向洋表示,自己比較看好聊天機器人的發展方向,微軟在中國推出了小冰,在日本做了Rinna,在美國推出了Zo,這些都是計算機試圖理解人類情感的嘗試。他提出,人工智能只有智商IQ是遠遠不夠的,還需要擁有情商。而且目前人工智能的水平甚至還沒有達到一個四五歲孩子的能力。

感知和認知是AI研究方向

沈向洋提到,人工智能這個詞彙是上世紀六十年代美國計算機教授約翰·麥卡錫(John McCarthy)最先提出的。人的智能分為感知和認知兩個部分。在感知方面,最大的一部分是視覺感知,然後是聽覺,之後還是其他感知。

在這方面,計算機進展很大。他預計,未來五年計算機語音識別可以達到識別人類的水平,未來十年計算機視覺也可以達到這一點。實際上,今天計算機視覺在人臉識別方面已經超過了人類,但到一個新地點,看到一個新東西就可以識別和理解,這大概需要十年的時間。

但談到認知,計算機卻遠遠沒有達到和人類相比的水平。首先是自然語言處理,然後是知識獲取。在自然語言處理方面,目前的深度學習方法雖然帶來了一些幫助,但解出來的效果還不是足夠好。

沈向洋繼續闡述說,深度學習是目前最大的突破,但也存在一個問題——雖然效果非常好,但卻沒有辦法解釋。人類可以分析出為什麼一二三,但深度學習和人工智能目前都做不到。

共同推進行業發展

在談到人工智能未來發展的規範時,沈向洋介紹微軟剛剛成立一個“人工智能倫理委員會”,由人工智能研究院和微軟法務部門的負責人擔任聯席主席,微軟每一個大業務和產品部門都會派代表參加委員會。

此外,去年12月,微軟還聯合谷歌、Facebook、亞馬遜、IBM五家人工智能領域的巨頭成立了人工智能合作組織(Partnership on AI),共同制定人工智能行業未來的發展規範。據沈向洋介紹,目前這個組織已經有100多家公司加入其中。

他提到,微軟會提供一個平臺和工具,向科研人員開放;同時也做垂直領域,包括Office AI和在雲裡面的應用。作為一家商業公司,微軟和其他平臺競爭很正常。谷歌和亞馬遜都在積極推進人工智能的研究,但大家作為一個社區,應該聚集一些力量。

“這方面可以從當初Android的興起中學習一些經驗。深度學習下一波浪潮中,我們怎樣可以做到更好。我也不覺得微軟一家公司就可以做出這些東西。現在微軟已經是非常開源了,包括完全開源的CNTK。開源對這個世界的科技發展產生了巨大的深遠影響,微軟會完全擁抱開源。”

如果說人工智能是貫穿未來微軟所有業務的血液,那麼領導微軟未來核心競爭力的重任就落在了微軟全球執行副總裁、人工智能及研究事業部負責人沈向洋的肩上。大會首日的主題演講,正是由沈向洋來最後進行壓軸技術展示。

在主題演講之後,沈向洋接受了包括新浪科技在內的中國媒體群訪。雖然已經在臺上演說了將近一個小時,但在近一個小時的採訪過程中,沈向洋一直站著侃侃而談。談到人工智能未來發展的時候,這位美國科技巨頭公司職位最高的華人臉上掛著一種自然的興奮。

AI重新定義微軟

談到如何具體實施“人工智能重新定義微軟業務”時,沈向洋表示,微軟所有的產品都必須要人工智能化。舉例來說,所有的Office產品都正在進行人工智能化,很多技術都還是剛剛開始。Powerpoint不僅加入了自動翻譯功能,還添加了圖片自動說明的功能。Word裡面也使用了人工智能技術,其中最激動人心的技術就是機器閱讀。

他介紹稱,微軟剛剛收購了一家加拿大人工智能創業公司Maluuba,後者就是用自然語言和深度學習的方法來做機器閱讀功能。這方面的技術會給Office帶來巨大的影響。目前微軟人工智能部門和Office部門正在密切協作。

而在微軟的轉型重點雲服務,微軟在努力用人工智能的雲幫助企業用戶,其中包括Azure雲服務中的認知服務,這會是Azure未來的重中之重。而Windows部門和Hololens也加入了很多計算機視覺和計算機語音方面的人工智能技術。

對話交互AI是方向

對話交互人工智能(Conversational AI)的概念是過去一年各大人工智能公司都在推崇的概念。沈向洋介紹稱,計算機最早是指令界面,後來是圖形交互界面,但這些還是需要人類學習計算機的語言。到了對話交互人工智能的階段,則是計算機來學習人類的語言。

但他強調,目前對話交互人工智能的產品研發還處在早期階段,還遠遠沒有達到通過對話實現人機交互。微軟的Cortana和蘋果的Siri都還是計算機根據人類指令完成一些任務。

沈向洋表示,自己比較看好聊天機器人的發展方向,微軟在中國推出了小冰,在日本做了Rinna,在美國推出了Zo,這些都是計算機試圖理解人類情感的嘗試。他提出,人工智能只有智商IQ是遠遠不夠的,還需要擁有情商。而且目前人工智能的水平甚至還沒有達到一個四五歲孩子的能力。

感知和認知是AI研究方向

沈向洋提到,人工智能這個詞彙是上世紀六十年代美國計算機教授約翰·麥卡錫(John McCarthy)最先提出的。人的智能分為感知和認知兩個部分。在感知方面,最大的一部分是視覺感知,然後是聽覺,之後還是其他感知。

在這方面,計算機進展很大。他預計,未來五年計算機語音識別可以達到識別人類的水平,未來十年計算機視覺也可以達到這一點。實際上,今天計算機視覺在人臉識別方面已經超過了人類,但到一個新地點,看到一個新東西就可以識別和理解,這大概需要十年的時間。

但談到認知,計算機卻遠遠沒有達到和人類相比的水平。首先是自然語言處理,然後是知識獲取。在自然語言處理方面,目前的深度學習方法雖然帶來了一些幫助,但解出來的效果還不是足夠好。

沈向洋繼續闡述說,深度學習是目前最大的突破,但也存在一個問題——雖然效果非常好,但卻沒有辦法解釋。人類可以分析出為什麼一二三,但深度學習和人工智能目前都做不到。

共同推進行業發展

在談到人工智能未來發展的規範時,沈向洋介紹微軟剛剛成立一個“人工智能倫理委員會”,由人工智能研究院和微軟法務部門的負責人擔任聯席主席,微軟每一個大業務和產品部門都會派代表參加委員會。

此外,去年12月,微軟還聯合谷歌、Facebook、亞馬遜、IBM五家人工智能領域的巨頭成立了人工智能合作組織(Partnership on AI),共同制定人工智能行業未來的發展規範。據沈向洋介紹,目前這個組織已經有100多家公司加入其中。

他提到,微軟會提供一個平臺和工具,向科研人員開放;同時也做垂直領域,包括Office AI和在雲裡面的應用。作為一家商業公司,微軟和其他平臺競爭很正常。谷歌和亞馬遜都在積極推進人工智能的研究,但大家作為一個社區,應該聚集一些力量。

“這方面可以從當初Android的興起中學習一些經驗。深度學習下一波浪潮中,我們怎樣可以做到更好。我也不覺得微軟一家公司就可以做出這些東西。現在微軟已經是非常開源了,包括完全開源的CNTK。開源對這個世界的科技發展產生了巨大的深遠影響,微軟會完全擁抱開源。”

脣語識別成人工智能研究新方向 市場有待深入挖掘  

目前人工智能研究方向有哪些?

  牛津大學研究員Yannis Assael表示:“我們相信AI脣讀是一種非常實用的輔助性技術,比如更智能的助聽器,不便出聲的公共場合,以及在嘈雜環境下精準的語音識別等。”舉例而言:通過脣語識別,讓無法開口說話的殘障人士“開口說話”;讓聽力障礙者和不少老年人更清晰地聽懂他人;而在軍事情報領域,脣語識別讓遠距離獲取情報成為可能。

人工智能技術方興未艾。在大數據分析、雲計算等基礎上已經發展起來眾多的實際應用技術,比如人臉識別、圖像識別、語音識別等等,不斷挑戰著人們對科技的新認知。最近,另一種應用技術——脣語識別技術,讓人們看到人工智能又給人們開了一扇窗。

據介紹,脣語識別技術,簡單地說即終端設備通過大數據技術,捕捉說話時的嘴部動作,來解讀說話人所要表達的內容。其最直接的現實應用場景就是,幫助聽力、發音障礙者實現與他人的順暢交流。

其實早在2003年,英特爾公司就曾推出一款名叫視聽說識別系統的軟件,電腦開發者可以在此基礎上研製讀懂“脣語”的計算機。而國外技術最純熟的當屬谷歌,其旗下公司Deepmind AI系統的脣語識別正確率在去年已經達到46.8%。

在國內,BAT這些互聯網巨頭雖未涉足這一領域,但也有一些創新公司在脣語識別技術方面取得了突破。6月20日,《重慶新聞聯播》節目就用長達兩分多鐘的時間,對海雲數據的脣語識別技術進行了報道。據報道,該公司脣語識別技術的中文識別率已高達71%,英文識別率達到80%,一度超過了谷歌Deepmind去年的成績。

脣語識別將成人工智能研究新方向

人們總是對新鮮的事物保持著好奇心,因此比較成熟的脣語識別技術一經曝光就引發了廣泛關注。

媒體曾對Google的脣語識別技術進行過多頻次、長篇幅的報道,並預測了這項技術的應用場景。比如,可以在嘈雜的環境中向手機發送文字信息,對無聲電影進行配音等等。

在剛剛結束的2017數博會上,海雲數據脣語識別技術與海爾、360等企業的技術一起入選“數博會2017十大黑科技”,引發國內大數據、人工智能行業從業者的廣泛興趣。中國媒體還將脣語識別技術和武俠小說中的“脣讀術”相提並論,為該技術平添了一層神祕色彩。

目前,全世界涉及脣語識別技術研發的企業除了英特爾、谷歌、海雲數據之外,還有微軟。早在2011年,歐洲遊戲媒體就聲稱微軟第二代Kinect體感外設非常強悍,足以“讀懂”脣語,還能夠檢測玩家的憤怒情緒。除了企業,研究脣語識別的還有一些機構,比如英國東英吉利大學等。

據瞭解,此前各企業和機構對於脣讀有不同的稱呼,比如lipreading(脣讀)、speechreading(視話),visualhearing(視覺來聽),hearingbyeye(用眼來聽)等,但技術思維理念是一致的。

有分析人士認為,在人工智能即將大範圍落地的前夜,脣語識別技術雖然相比其他技術冷僻一些,但也讓業內看到了新的方向,相信今後會有更多的公司進入這個領域。

脣語識別當前應用場景相當廣闊

基於脣語識別技術開發的產品絕不是一個小眾產品。海雲數據創始人、CEO馮一村介紹說:“除公共安全領域外,脣語識別還可應用到移動支付、軍事情報、殘疾人教育等領域。”

比如在公共安全領域,遍佈街頭的攝像頭為安全部門提供了大量的無聲視頻資料,利用脣語識別技術可以對拍攝到的違法分子的口型進行識別,進而獲取有價值的偵查信息。這將是一個巨大的2B市場。

再比如以2C為主的移動支付領域,脣語識別技術也可為支付安全提供更大的保障。尤其是在軍事情報領域,隨著技術的發展,遠距離獲取情報獲將成為可能。

來自牛津大學脣語技術研究LipNet團隊的Yannis Assael說:“我們相信,機器脣語解讀器有非常大的應用前景,比如改進助聽器,公共場所的無聲指令(Siri再也不必聽到你的聲音了),嘈雜環境下的語音識別等。”

有報道認為,人工智能未來將會出現一個數萬億美元的巨大市場,在面對具體乃至細碎的應用場景時,人工智能的細分程度勢必如百年前的電力那般觸角龐雜。廣袤的嫁接空間意味著,從真實應用場景出發,人工智能領域會出現不少藍海市場,被國內巨頭忽視的脣語識別也是其中之一。

國內脣語識別市場有待深入挖掘

相較於國外脣語識別技術“多企爭流”的情況,在國內研發該項技術的企業少之又少——在BAT等紛紛佈局眼下大熱的圖像識別、語音識別、人臉識別、無人駕駛技術的大背景下,僅僅有海雲數據少數創新公司在該項技術上進行了佈局並初步形成研究成果。

究其原因,其一是人工智能細分領域紛繁複雜,這些巨頭不可能事無鉅細面面俱到;其二是圖像識別、語音識別等技術相對成熟,可以較快地投入市場,在逐利的驅使下,肯定要首先進軍這些領域。不過,這也從側面幫助像海雲數據這樣的創新公司在BAT巨頭未涉足的領域獲得站穩腳跟的機會,甚至是提前建立起技術壁壘。

業內人士認為,脣語識別雖還未迎來爆發的階段,但網上隨處可見、海量的視頻資源已經為其做好大數據方面的準備,隨著技術的不斷進步,這項技術與將獲得越來越快速的發展。

數據顯示,DeepMind與牛津大學的研究者使用總長超過5000小時的節目對人工智能脣語識別系統進行訓練,正確率已經達到46.8%,比專業讀脣人士高出了大概3倍。而海雲數據以長達1萬多小時的新聞素材為“語料”模板,將中文的識別率提升到了71%。“未來隨著‘語料’越來越多,識別率也將穩步提升。”馮一村介紹說。

技術的不斷進步也將推動市場的深入挖掘。目前,脣語識別還沒有到商用的地步(一般識別率高於95%即可達到商用標準),但隨著技術的不斷進步和識別率的提升,脣語識別市場或將迎來爆發,其對應的安防、軍事、支付等行業也將發生巨大的變化。

浙江大學獲微醫集團捐贈1億元 成立睿醫人工智能研究中心

從上世紀50年代技術萌芽到70年代正式參與到醫學診斷中,醫學人工智能已經快成為醫療科技進步的代名詞。人工神經網絡和深度學習領域的不斷進步,以及在醫療領域不斷興起的創業潮,都在對現代醫學的發展進程產生重大影響。

近年來,人工智能領域大事件不斷。IBM自2006年開始研發Watson、2014年穀歌成立收購DeepMind,而在2016年,又因AlphaGo和李世石對弈、Google、Facebook、Amazon、IBM和Microsoft宣佈成立AI合作組織等產生的大事件效應,都為人工智能領域的發展有著深遠意義,也促使該領域迎來了一波又一波的創業潮。

據CBI報告顯示,2016年550家人工智能初創企業共獲得50億美元投資。Gartner副總裁Tracy Tsai則進一步預測,到2020年,人工智能將產生 3000 億美元的商業價值。人工智能+醫療健康的創業項目數量在逐年增加,中國出現了數家值得關注的初創公司,甚至知名高校也跨入這個領域。

名校構建中國首個開放式醫學人工智能平臺

2017年3月25日,中國著名學府浙江大學宣佈成立睿醫人工智能研究中心,中國人工智能科學帶頭人、浙江大學校長吳朝暉教授帶頭成立專家委員會,並在浙江大學和杭州灣信息港同時掛牌。中心宣佈將通過“產學研”一體化模式,構建中國首個開放式醫學人工智能平臺。

浙江大學在醫學人工智能方面有著足夠的底氣,其計算機學院下設的人工智能研究所是中國最早的人工智能研究機構之一。在2016年國家科技獎評選中,浙江大學有9項獲獎位列全國高校第一,在醫藥學、工學及信息科學等領域的能力國內領先,醫學部各附屬醫院是國內臨床醫學的佼佼者。

據動脈網(微信號:vcbeat)瞭解,睿醫人工智能研究中心將依託浙江大學計算機學院、信息學院、醫學院、藥學院、生儀學院等相關院系及附屬醫院的科研實力,提升人工智能在醫療健康領域的整體水平。

重點研究在臨床大數據、影像學和基因組學上的醫學人工智能共性關鍵技術,重點搭建醫學人工智能服務平臺,培育醫學人工智能產業生態環境和第三方醫學人工智能服務企業,建立多學科多機構協同創新機制,形成相關行業規範標準,打造醫學人工智能高等教育體系等。

為了支持睿醫人工智能研究中心的發展,浙江大學校長吳朝暉成立專家委員會、計算機學院吳健教授為中心負責人成立核心研發團隊,並配備相應運營和管理輔助人員,同時為中心提供一定數量的博士及碩士研究生名額,推進醫學人工智能領域的人才培養。

與此同時,睿醫人工智能研究中心同時具備科研平臺屬性和產業轉化平臺屬性,它不僅是醫學人工智能科研中心,還面向浙江大學附屬醫院及全國醫療機構和學科帶頭人開放技術合作和應用合作,實現與醫療機構診療經驗、學術研究、臨床數據的對接,尋求科研成果向產業成果的轉化,並以產業發展反哺科研工作,實現產學研的協同。

“我們會利用浙江大學基礎優勢,以開放姿態和各大醫療機構及學科帶頭人合作,打通數據源,建立多學科、多機構協同機制,爭取早日在醫學人工智能的關鍵性技術上取得突破。”吳朝暉校長表示。

優化醫療服務體系,應用場景廣闊

人工智能正在成為全球競爭的技術制高點,並於2017年首次進入全國兩會政府工作報告。人工智能在醫療領域中的大規模應用始於2011年,目前在虛擬助理、醫學影像、藥物挖掘、營養學、生物技術、急救室/醫院管理、健康管理、精神健康等領域均有涉及。

由此可見,醫學人工智能擁有巨大發展前景。以睿醫人工智能研究中心為藍本的高校機構,對於加速人工智能技術在醫療健康領域的應用,加快重大疾病防控技術突破、佔據生物醫學相關新興戰略性產業發展的主導權、保護醫療健康數據安全、優化醫療服務體系均具有真實價值。

而醫學人工智能的應用,將有助於改善醫療服務體系面臨優質醫療資源配置不均衡、基層醫療機構和醫生服務能力不足、以疾病治療為中心的“被動醫療”服務模式等諸多現狀,優化醫療服務體系。

目前人工智能研究方向有哪些?

在睿醫人工智能研究中心的發佈會現場,我們又見到了一個熟悉的身影——微醫。微醫向浙江大學捐贈1億元人民幣支持睿醫人工智能研究中心發展。

微醫為什麼會向浙江大學捐贈,支持浙江大學創建睿醫人工智能研究中心?微醫董事長兼CEO廖傑遠向動脈網記者道出了背後的原因。

廖傑遠認為,許多人對醫學人工智能的理解是碎片性的。醫學人工智能的核心有三要素:數據源、技術能力和應用場景。不少醫學人工智能企業都是從技術開始,但是技術和算法模型,都是通用的,關鍵還在於後天的“教育”。

首先,有沒有大數據源,不斷訓練它,讓它越來越智能。從一個病種、病程、病點開始,到能夠成為醫生的助手,這就不是單點行為,一定是一個系統。這個系統的後端,數據源在醫院,在各種電子病例裡;

其次,醫學人工智能形成的醫學能力,要有各個醫學學科的能力,這樣才能形成真正的服務體系;

最後,要有不同的應用場景。醫院、醫生、患者都是不同的應用場景,三者打通才能成為真正的醫學人工智能平臺。

如果這個平臺只依靠一家企業,或者只依靠某一家機構都比較困難。而浙江大學的條件是絕無僅有的,浙江大學的醫、工、信的能力都很強,1981年就開始做人工智能研究,有深厚的底蘊。其校長吳朝暉教授更是人工智能的專家,1991年曾到德國人工智能研究中心深造兩年,一直從事相關領域的研究。

因此,從條件上來說,浙江大學可以牽頭籌建人工智能研究中心,但高校的每筆經費運用都有指向性,浙江大學要集中大力量來專注醫學人工智能,也很需要人力和資金的支持。微醫捐贈的1億萬,正是從資金上推動了睿醫人工智能研究中心的發展。

當然,僅僅是微醫捐的錢是不夠的,國家也需要有相應的配套,還需要更多的機構參與,才會形成足夠的力量推動這件事。

形成醫學人工智能的“中國力量”

在中國面臨大專家、大醫生稀缺,基層醫療資源薄弱的現狀下,醫學人工智能的大跨步前進給我們憧憬了一個可期待的未來。睿醫人工智能中心出現在這個時間節點,有它的必要性和必然性。正如浙江大學校長吳朝暉所想,我們也期待類似睿醫人工智能中心這樣的高校科研機構承擔起建立自主知識產權的醫學人工智能核心的能力,以此創建中國自主知識產權的醫學人工智能引擎,並與各大醫療機構、各學科專家及產業界合作,形成醫學人工智能的“中國力量”。

本文由大比特資訊收集整理(www.big-bit.com)

AI望远镜
2017-09-28

比較熱門的有,一是圖像識別,刷臉支付和自動駕駛,是代表場景。二是語音識別,語音錄入和機器人聊天是代表場景。三是自然語言處理,文本識別,智能家居,聊天機器人都有用到。四是邏輯推理,比如會下棋的阿爾法狗,IBM開發的沃森醫生系統,高考機器人等。

相關推薦

推薦中...