語音識別最大的問題解決了!在嘈雜的環境中都可識別你的聲音

語音識別最大的問題解決了!在嘈雜的環境中都可識別你的聲音

我們都知道,人工智能的應用層,分為幾個大的領域,而語音識別則是目前被應用到的最廣泛也是最成熟的技術。在語音識別中,一直有幾個難點尚未突破,比如大部分手機上的語音識別功能,只能完成近場識別,稍微離遠一點,就無法工作了。或者在嘈雜的環境中或者多人說話的情況,無法實行鍼對性識別。在今天,這一項技術有了質的突破。

語音識別的痛點

語音識別是目前應用最成熟的人機交互方式,從最初大家體驗過的有屏手持設備這種近場的語音識別,如Siri以及各種語音助手,到現在,語音識別的應用已經完成了向智能硬件以及機器人上延伸。不過,新的人機交互對硬件、算法要求更加苛刻,各企業正面臨著巨大的挑戰。

對於語音識別的痛點,大家如果使用過,應該都能舉出一些例子。比如說話要靠近,發音要標準,環境要安靜,不能持續對話,不能打斷等。

語音識別最大的問題解決了!在嘈雜的環境中都可識別你的聲音

不只是語音,包括圖像、障礙物檢測等技術,都會遇到這樣的問題,比如人臉的識別,對光線、角度、距離都有一定的要求。 歸結為一點就是,當前人機交互在複雜環境的自適應性方面,還有很多問題需要解決。這還只是感知層面,另外還包括認知層面,AI目前還不如我們想象的這麼聰明,目前不能完全自主學習,仍然需要人的介入,比如知識庫的導入,機器行為的糾正等,都需要人的參與。

當前的人機交互產品,在真正面對用戶時,在面對複雜環境時,魯棒性還不夠好。今天的分享,如果想要解決這些問題,不管是通過算法,還是工程,抑或產品,都是我們可以選擇的途徑。

可以分離多個聲音的技術

像亞馬遜的Echo和Google Home這樣的設備通常可以處理來自一個人的請求,而在一些嘈雜的環境中,比方說酒會上幾個人一起發言時,它們就會不知所措。現在,一個可以實時分離多個揚聲器聲音的人工智能技術為自動語音識別帶來了很大的幫助。這一技術由位於馬薩諸塞州坎布里奇的三菱電機研究實驗室的研究人員開發,本月在東京舉行的先進技術綜合展覽會上首次公開展示。

語音識別最大的問題解決了!在嘈雜的環境中都可識別你的聲音

該技術使用了一種被稱為“深度類聚”的機器學習來識別多個揚聲器的聲紋(voiceprint)特徵。它會將每個人聲音裡的不同特質進行分類以便完成多個聲音的分解, 之後會重組每個人的話語。 三菱電機的發言人Niels Meinke說:“該技術經過了100個英語揚聲器的培訓,但即使講話者使用了日語, 它仍然可以完成語音分離。”

Meinke表示這個系統可以將兩個人的言語分開,並將其重新構建,準確率可以達到90%。如果有3個聲源,準確性會有所下降,但仍高達80%。不管是哪種情況,這都是之前未有過的。而傳統方式,比如將兩個麥克風放於聽者耳下收集信息,準確性只有51%。

未來語音識別的發展趨勢

複雜的環境,一方面是外在環境的複雜,另一方面是方言和口音。外在環境複雜包括噪聲、混響、回聲等,而且噪音又分為不同的會議室、戶外、商場等不同環境,為了解決這些問題,除了單通道語音增強技術,現在普遍是採用上面提到的麥克風陣列硬件和相關算法實現。

為解決這方面的問題,分離器通過以下的技術方案,去適應各種複雜環境的要求。包括以下方面:

1) 提供條形、環形、球形的四麥、五麥、八麥等多種不同的麥克風陣列構型,以適應不同的產品需求,比如叮咚音箱採用的就是環形8麥的方案。

麥克風陣列技術雖然已經可以達到相當的技術水平,但是總體上還是存在一些問題的,比如當麥克風和信號源距離太遠時(比如10m、20m距離),錄製信號的信噪比會很低,算法處理難度很大;對於便攜設備來說,受設備尺寸以及功耗的限制,麥克風的個數不能太多,陣列尺寸也不能太大。而分佈式麥克風陣列技術則是解決當前問題的一個可能途徑。

所謂分佈式陣列就是將子陣元或子陣列布局到更大的範圍內,相互之間通過有線或者無線的方式進行數據的交換和共享,並在此基礎上進行廣義上的聲源定位、波束形成等技術實現信號處理。

2)不同環境的語音識別聲學模型,如上面提到的遠場拾音,專門針對遠距離拾音的環境進行訓練;

3)基於特定人群的模型訓練,目前已經為面向兒童的玩具方案,專門訓練針對兒童的聲學匹配模型;

4)為每個應用、每個用戶,提供個性化的語言模型。

這一切都是為了語音識別的終極目標:人機交互的融合做準備。融合是人機交互的必然趨勢,三菱完成這項技術後,將會廣泛將硬件傳遍給各大廠商,對於本品牌的語音識別研究也將更進一步。

在初步測試中,系統可同時分離多達五個人的聲音。 Meinke說:“該系統在一系列產品中進行語音分離,包括電梯,空調設備和其他家用產品。”事實上,三菱目前也正在進行將該語音識別技術用於電梯和空調等產品的研究,為了下一步智能家居的風口,做全面的準備。

【本文系人工智能觀察作者AI小智君原創,轉載請聯繫作者並註明出處,更多精彩內容請持續關注】

相關推薦

推薦中...