從算法平臺到機器視覺和語音識別,優必選全面佈局人工智能

機器之心原創

作者:杜雪

從 2008 年到 2012 年,周劍用了第一個五年時間,研發出滿意的舵機。這成為周劍在 2012 年創立優必選科技(下簡稱優必選)的底氣,也成就了優必選的第一個五年————舵機是優必選的核心技術,覆蓋 Alpha1、Alpha2、Jimu 和 Cruzr 等重要產品,由於市場對其產品的看好,公司也在 2016 年完成 B 輪 1 億美元融資,估值超 10 億美元,入選 CB Insights 發佈的全球獨角獸榜單。

從算法平臺到機器視覺和語音識別,優必選全面佈局人工智能

在舵機技術上站穩腳跟之後,周劍為優必選下一個五年定調。今年 2 月,優必選創始人兼 CEO 周劍宣佈,「2017 年優必選將重點佈局人工智能領域,通過產品創新和商業創新實現 15 億元的銷售目標。」

今年的兩會將人工智能寫進政府報告,人工智能在國內的發展達到了前所未有的熱度。無論是 BAT 這樣的巨頭,還是眾多創業公司,都試圖在人工智能上找到能落地的應用場景。周劍認為,「在人工智能這件事上,優必選有天然的優勢。因為從某種意義上來說,機器人是人工智能落地最好的平臺。」


尋找人形機器人商業化突破口

「機器人的最終形態應該是能適應人類生活環境的雙足人形機器人,比如它能像人類一樣,在多種環境中行走,比如上下樓梯,這其中的核心問題就是驅動,只有解決這個問題,機器人才能真正意義上進入家庭環境。」周劍說。目前國際上名氣較大的人形機器人產品並不多,比如軟銀收購的 Aldebaran Robotics 公司研發的人形機器人 NAO、以及本田的 ASIMO 機器人和波士頓動力的輪式、腿式機器人等。

在周劍看來,目前市面上很多機器人產品都是過渡型產物,比如現在的一些音箱產品。「如果實現商業化,是沒有人願意跟一個音箱對話的。」因為智能家居最終無法滿足人類的情感需求,「它代替不了類似於《太空旅客》真正的人形機器人。」

然而,目前人形機器人在驅動,包括關節驅動、運動技術、控制運動算法上面,還沒有實現真正突破,尤其是可商業化的驅動技術。據周劍介紹,在驅動方面,波士頓動力用的是液壓技術,本田的阿西莫(ASIMO)機器人用的是電機伺服的控制方式,這兩種技術都能實現不錯的驅動,但是問題在於成本太高,阿西莫(ASIMO)一臺機器人搭出來需要 200 多萬美金。

從算法平臺到機器視覺和語音識別,優必選全面佈局人工智能

除了高昂的成本外,使用中繁瑣的技術方式也讓一些機器人很難真正走進市場,比如 ASIMO 機器人的傳動中用了 20 多根皮帶,在使用過程中,每隔一段時間都需要重新打開機器人內部來調整皮帶的鬆緊度。這種技術方式導致 ASIMO 很難實現商業化量產,而且本田在這條技術道路上耕耘了幾十年,某種程度上有些積重難返,即便他們的核心算法和機器人軀幹部分都搭建的很好。

因此,用高性價比的技術方式,讓人形機器人價格降下來,被一般家庭所接受,是優必選的目標。周劍說,「優必選一直在朝著一個能夠真正讓驅動關節模塊化、商業化的方向去努力,所以我們現在做的伺服舵機,包括在腿部的一些舵機,某種意義上就是在朝著商業化目標努力。」

人形機器人的市場才剛剛開始,優必選需要做一些比較前沿性、引導性的工作。「未來我們希望在某種意義上建立一套全球化的機器人標準,比如人形機器人的標準是什麼、規格是什麼、它的曲軸運動,包括人工智能的一些基本的需求。」

不過,雖然輪式機器人不是人形機器人的最終形式,但周劍也坦言,「目前技術平臺下面,輪式機器人還有一些優勢,包括在 2B 的一些場所。」因此,優必選在今年年初的 CES 上推出了首款商用服務機器人 Cruzr。Cruzr 是首款提供企業級商用服務的機器人,可為客戶提供定製的人工智能商務服務。


全面佈局人工智能戰略

優必選的機器人研發從舵機開始,經過近 10 年的研發,舵機已經成為優必選的核心技術,並由此開拓了多個產品線。在舵機這條技術產品線上,優必選一直專注於核心零部件的供應,硬件開發逐漸成為優必選的優勢。

而機器人商業化所需要的語音識別、機器視覺以及算法平臺等軟件技術能力,則是優必選明顯存在的劣勢。周劍也坦言,「優必選是硬件起家,舵機一直是其引以為豪的核心技術,而軟件是最薄弱的地方」,這也是優必選決定大力佈局人工智能的原因。

據周劍介紹,優必選在北京、硅谷分別設有研發中心,研發方向側重在機器視覺、語音識別、語義理解、算法平臺等人工智能領域,博士背景的核心研發人員達到數十人,公司在人工智能方面投入的資金比重也大大提升,佔總營收的 45%。

除了大型的伺服舵機關鍵驅動技術外,算法平臺和人工智能,將成為優必選最為重要的發展陣地。

周劍希望能夠自助搭建出一個類似於比波士頓動力更好的平臺的一個算法。在此之前,優必選對谷歌、波士頓動力、本田等全球所有大型人形機器人公司的技術都進行了長期研究。在周劍看來,與優必選在驅動產品上下功夫不同,「這些機構不算純商業化的公司,也根本沒有打算很快推出商業化的產品。」他接著補充道:「我們現正在研發中的伺服舵機,跟波士頓他們的完全不一樣。此外優必選把能耗看的很重,在運動算法上投入了很大力量。」

從算法平臺到機器視覺和語音識別,優必選全面佈局人工智能

在人工智能方面,優必選主要力量放在機器視覺和數據上。周劍解釋稱:「因為信息來源大部分還是來自機器視覺,另外由於機器視覺技術需要更大量的數據,數據是其要推動的技術。」比如光線的細微變化都能影響到機器對物體的判斷。這一點周劍印象頗深,他舉了一個例子,在家庭廚房場景中,炒菜時的油煙會導致機器人的視覺判斷模糊,針對這個問題就需要做霧化、去白、去油煙的技術。

事實上,優必選去年年底就開始為人工智能佈局招攬人才,前 IEEE 主席霍華德博士、清華大學趙明國教授、歐洲科學院院士陶大程博士,先後加入並分別擔任其教育 CTO、「人形機器人首席科學家」。

去年科大訊飛入股優必選,也給了後者在語音識別上得到了強有力的支撐,周劍稱,訊飛的技術「能用的我們都會拿來用」。

在視覺和語音之外,另一個無法迴避的問題是語義理解。「這是一個全球性難題」,周劍說,「單純的自然語言理解(NLU)解決不了所有的機器人問題,未來的識別理解是多模態的,是基於視覺、語音、語意的多模態的理解。包括識別人體的姿態,人類的動作有很多,機器人會做很多動作,到底這個動作的目的、意義是什麼?」比如,當兩人第一次見面時,舉手就意味著是握手打招呼,在離別的時候,舉手的含義就是道別,這些都需要機器人能夠準確的識別。

但優必選並不打算全面開展這些技術的自主研發,周劍表示,「不可能所有的東西都由優必選自己來做,可以通過融資來收購、併購一些技術公司。」據瞭解,優必選已經有了比較中意的合作對象,可能會對其進行戰略投資、入股,甚至是更加深入的合作,與此同時,其新一輪融資也在進行中。

從算法平臺到機器視覺和語音識別,優必選全面佈局人工智能

相關推薦

推薦中...