思必馳:專注人性化的智能語音交互技術

近幾年,隨著蘋果Siri、搜狗“知音”、Facebook聊天機器人Messenger Platform等推出,再次炒熱了公眾對智能語音新一輪關注熱潮,人們對語音交互及其背後配套的人工智能也越來越重視了。確實,如果人工智能得到了長足進步,最容易被大眾所體驗感知的是什麼服務呢?無疑,語音交互是最直接的一種手段。

作為中國語音交互人工智能領域的領先者,思必馳是國內唯一擁有人機對話技術,國際上極少數擁有自主產權、中英文綜合語音技術(語音識別、語音合成、自然語言理解、聲紋識別、性別及年齡識別、情緒識別等)的公司之一。思必馳於業內率先推出多輪對話、可糾正可打斷的認知智能、實時轉錄的語音輸入板、環形6+1遠場麥克風陣列、AIOS思必馳對話操作系統。

“環形六麥陣列”人性化的語音交互技術

環形六麥陣列是在“環形6+1遠場麥克風陣列”基礎上全面升級的一項語音交互技術。主要針對智能家居和智能機器人提出的軟硬一體化解決方案。支持回聲消除、聲源定位、波束成形、語音增強等功能。同時,思必馳提供雲端第三方內容服務,讓大數據精準服務於智能語音領域。

思必馳:專注人性化的智能語音交互技術

環形六麥陣列(正面圖)

1、語音增強:

解決噪聲環境下的識別問題需要從抑制噪聲和語音增強兩方面入手。思必馳環形六麥陣列利用拾音波束成形,採用獨特算法,有效抑制波束之外的噪聲,同時融合語音信號的空時信息,從含噪聲的語音信號中提取出純淨語音,有效地增強說話人語音。

2、聲源定位:

思必馳環形六麥陣列實現360°環形拾音,多麥定向,準確計算目標說話人的角度和距離,實現對目標說話人的跟蹤以及語音定向拾取,精準度控制在±10°以內。聲源定位功能不限制說話人運動,不需要移位操作,這增強了產品設計的靈活性和功能的多樣性,可有效地實現對產品的多功能輔助作用。

3、遠場交互:

思必馳環形六麥陣列在前端充分利用其空域濾波特性,抑制拾音波束外的回聲、混響等噪聲,進行語音增強處理,輔之以語音識別引擎的二次處理,實現優質的遠場識別交互。思必馳已實現了國內領先的5米遠場交互,5米、3米、1米識別率分別為92%, 94%, 96%以上,遠場識別媲美近講。

4、打斷糾錯:

思必馳環形六麥陣列融入了自適應、理解糾錯、智能反饋等認知技術,重新提取大數據因素,並進行二次計算,實現智能糾正打斷,能夠適應更多的應用環境,具有進化調整功能,從而在人機交互的過程中,使機器更“聽話”。

5、多輪對話:

基於對話邏輯,允許人機進行多輪語音互動,讓機器理解用戶的深層意圖並提供反饋。而機器可以通過深度學習,可以根據上下文語境準確追蹤用戶意圖,並隨著數據的積累而越發靈活精準流暢。

6、後端服務:

目前思必馳環形六麥陣列解決方案整合了高德地圖、酷我音樂、蝦米音樂、喜馬拉雅電臺、考拉電臺、大眾點評等生活服務方面的諸多關鍵資源,致力將智能語音服務整合成一體化產品,打造體驗閉環,形成完整的生態鏈。

環形六麥陣列推動了智能機器人、智能家居等領域便捷化的發展,淘汰按鍵、遙控器、APP等控制終端,實現純語音控制的未來便捷生活。促進了智能語音交互技術的發展,有利於未來智能人機交互的多模態結合和人工智能整個行業的發展。

本次5月18號、19號於北京舉辦的第五屆國際服務機器人千人大會上,思必馳將攜帶最新升級版“環形六麥陣列”軟硬一體化方案出席峰會。思必馳CMO龍夢竹女士也將在高端對話環節亮相。究竟“智能語音能否成為人工智能交互最天然的手段”,讓我們在大會上一見分曉吧!

相關推薦

推薦中...