微軟谷歌的黑科技似曾相識,下一個扛起 AI 創新大旗的是誰?

週一開始,微軟、Google 的年度開發者大會相繼召開。

過去幾年,隨著微軟從一家 Windows 公司轉型到一家雲優先(Cloud First)的公司,Build 大會的主角也成了公共雲平臺 Azure、SaaS 產品Office 365以及基於 Azure 的認知服務。今年的大會也不例外。第一天的主旨演講裡,微軟 CEO 納德拉介紹了微軟在雲、IoT 以及 AI 領域的諸多進展。

秉承「人工智能優先(AI First)」的 Google,也一股腦地將眾多 AI 特性注入到全新的 Android Q 系統、物聯網設備以及 全新的 Pixel 智能手機裡。

微軟谷歌的黑科技似曾相識,下一個扛起 AI 創新大旗的是誰?

撇開兩家公司各自不同的領域,可以非常清晰地看到微軟與 Google 都將 AI 作為提升產品體驗重要支撐。以微軟為例,納德拉特別談到了微軟在 AI 領域的新產品,尤其是基於 Azure 的語言識別服務的演示引發一陣尖叫,這個名叫「Azure Speech Service」的產品可以快速識別人物對話,並實時轉化成為文本,對於交談裡的專業名詞以及談話所涉及的領域,該產品也可以自動適應,從而不斷優化生成的文本內容。

微軟谷歌的黑科技似曾相識,下一個扛起 AI 創新大旗的是誰?

而在 Google 的場子裡,介紹新一代 Google Assistant 的環節掌聲不斷,一方面 Google 成功展示瞭如何將語音識別模型從數百GB的數據量減少到半千兆字節,另一方面,Google Assistant 未來也將內置到 Google 的多個產品線裡,比如 Waze,可以利用語音喚醒駕駛模式,幫助用戶通過語音處理駕駛過程中的一切事物。

但在尖叫、鼓掌的同時,卻也難免失落,尤其是在語音這個 AI 的關鍵領域,兩家公司並沒有帶來實質性的突破,很多「黑科技」早已似曾相識。

語音在中國是一門「普通」技術

語音與文本的轉換由來已久,現代計算機出現前,貝爾實驗室嘗試通過將電話裡聲音轉換為文字,最終實現了識別並轉換 10 個英文數字的「壯舉」。隨著上世紀人工智能的興起,尤其一些學者將人工神經網絡引入到語音識別領域,語音識以及轉換的精準度越來越高。

如果說海外的語音文字轉換還是停留在專業領域的「高科技」,那麼在中國這個特殊市場,語音文本轉換卻從一開始就進入到尋常百姓的手掌上,那就是智能手機。

究其原因,一方面是受限於智能手機的小屏幕,過往基於鍵盤的輸入方式逐漸「失寵」,語音輸入的需求順勢而生;另一方面,則是隨著中國移動互聯網市場的持續下沉,無論是受教育程度還是使用門檻,語音都遠勝與文字。

2014 年,百度董事長兼首席執行官李彥宏在百度世界大會上預言,未來五年語音圖像的搜索將超過文字。這在當時頗為大膽的預言如今來看可謂頗具前瞻性。

微軟谷歌的黑科技似曾相識,下一個扛起 AI 創新大旗的是誰?

過去的五年時間裡,基於語音識別、語音轉換的消費級應用層出不窮,包括語音搜索、輸入法、語音轉錄工具等,並從軟件過渡到硬件,比如大量翻譯機的出現,也是基於語音識別轉換後的再創新。

某種意義上說,上述這些大量基於消費市場的語音應用和硬件,也為語音識別算法的提升提供了海量的數據,進一步提升了語音應用的實用價值,使其不再侷限在炫技的場景裡。

比如在地圖導航的場景裡,2018 年的百度 AI 開發者大會上,基於語音語義化,用戶可以說出一連串的導航需求,地而系統可以識別、理解,從而做出更準確的導航。

而在輸入法中,2019 年 1 月,百度將流式截斷多層注意力建模(SMLTA)應用到語音輸入上,不僅解決了過往語音識別轉錄文字的高時延難題,還為離線語音識別轉錄文字的突破提供了技術保障。

微軟谷歌的黑科技似曾相識,下一個扛起 AI 創新大旗的是誰?

從這個角度去看,無論是微軟的Azure Speech Service 還是 Google Assistant 的新特性,其應用落地的速度落後於中國。

更進一步,語音不僅成為中國普通用戶與設備交互的全新方式甚至是唯一方式,也正在成為各行各業數字化升級轉型的助推器,這其中的一個重要代表就是百度大腦。

如何讓技術價值變成行業價值

百度大腦發佈於 2016 年,語音技術就作為其中的核心能力,貫穿到搜索、輸入法到地圖,逐步成為這些產品的「殺手鐗」。而隨著百度大腦在 2018 年進化到 3.0,更多的能力被開放出來,語音能力也成為推動行業轉型升級的重要「技術燃料」。


微軟谷歌的黑科技似曾相識,下一個扛起 AI 創新大旗的是誰?

事實上,語音賦能行業的場景非常多。

以客服行業裡的電話客服為例,客服質檢是一個不可缺少的工作,如何高效地進行客服質檢、如何根據質檢結果提高客服質量,也是全行業的共同難題。

國內已經有不少科技企業,將語音識別 API 作為一種服務供客服公司使用,不僅可以把語音轉換為文本,還實現了敏感字檢測,以此為模型,打造了一個質檢模型,大幅度提升了客服質檢的效率,也提高了電話客服質量。

更近一步,利用語音語義化帶來的技術提升,電話機器人客服的能力也在快速成長中,這對各行各業提升客服效率都將是巨大的利好,這也是 Google、微軟與百度共同努力的方向。

類似這樣的案例還有很多,在產業互聯網的大趨勢下,以語音為代表的 AI 能力正在助力中國的各行各業,而諸如百度、阿里這樣的行業巨頭,也在不斷降低語音以及其他 AI 能力的獲取門檻。比如百度一直宣傳的「用腦量」,即開發者、企業調用百度大腦技術能力支撐其業務的數量。參考 2017 與 2018 增長數據,百度語音技術日調用量增長了 94%,日活躍開發者增長了83%,這也從一個側面展現出中國開發者、企業對於語音賦能的認可。

尾巴:下一個「黑科技」在哪裡?

人工智能毫無疑問是當下全球科技公司追逐的焦點,而另一個毫無爭議的判斷則是,中美兩國正在上演 AI 領域的「二人轉」。

但這又是一場不匹配的戰爭,中國巨大的市場和豐富的場景,已然讓中國擁有了獨特的優勢。

當 Facebook 開始用 AI 推進產品轉型時,大洋彼岸的中國社交公司們,早已將 AI、機器學習應用到多個場景裡;而當微軟的語音轉文本、Google Assitant 語音導航讓美國科技媒體興奮時,我們卻也發現,語音技術以及背後的價值,早已在中國消費者日常使用的輸入法、搜索、地圖裡,並且還正在通過諸如百度大腦這樣的開放平臺賦能到其他行業。毫不客氣地說,此番微軟、Google 的所謂「黑科技」,不過是中國科技公司早已佈局的產品而已。

那麼,下一個「黑科技」,尤其是 AI 領域的「黑科技」會在哪裡呢?短期內的技術突破並不現實,基於豐富場景的技術落地才是「黑科技」可能扎堆的領域,這也成為中美兩國 AI 領域的最大不同,當 Facebook、微軟、Google 等美國公司無法在 2019 年帶來技術突破時,也將舞臺留給了中國公司,比如兩個月後的百度 AI 開發者大會,是否繼續能扛起 AI 創新的大旗呢?讓我們拭目以待。

相關推薦

推薦中...