以脣識人!海雲數據將脣語識別與大數據結合,中文準確率達70%

大數據 人工智能 語音識別 三星 品途商業評論 2017-04-05

相比現在火熱的人臉識別、語音識別甚至三星引以為傲的虹膜識別,脣語識別或許沒有那麼高調,不過這依然是人們重點觀察的方向之一。Alphago所屬的Deepmind就一直在脣語識別方向嘗試。

谷歌DeepMind部門和牛津大學的研究者使用總長超過5000小時,使用了 2010 年 1 月至 2015 年 12 月間的電視節目素材,包括BBC 各類節目, 如Newsnight、BBC Breakfast、Question Time 等,總語句超過118,000的新聞視頻對 AI 系統進行訓練,然後使用 2016 年 3 月 - 9 月間播出的節目進行 AI 性能測試。

測試結果發現,系統通過“觀看”說話者嘴部動作便可以準確識別出整個句子。給予相同的視頻素材,專業的脣語識別專家能夠達到12.4%的正確率,而AI系統識別正確率是46.8%,高出了大概整整3倍的準確率。

以脣識人!海雲數據將脣語識別與大數據結合,中文準確率達70%

在國內同樣有一家在研究脣語識別的公司,並且打算將這項技術應用落地。海雲數據創始人馮一村在29日舉辦的亞洲大數據可視分析峰會上介紹了與重慶公安科研所共同研發的脣語識別技術。

自2016年12月以來,海雲研究院開展了中文脣語識別模型的研究工作,取得了一定的成果。目前看來,中文識別模型準確率已達到70%,英文的準確率可80%-90%。

馮一村介紹,脣語識別系統使用機器視覺技術,從圖像中連續識別出人臉,並提取此人連續的口型變化特徵,隨即將連續變化的特徵輸入到脣語識別模型中,識別出講話人口型對應的發音,從而計算出可能性最大的表達語句。

馮一村表示,脣語識別技術可以運用到日常生活、社會公益、體育賽事裁定等領域。它可以幫助聾啞人、老年人交流,對體育賽事中的語言暴力也可以實現“脣語解鎖”,便於裁判。

與此同時,在研發過程中海雲數據也一直在深挖脣語識別的實際應用價值。結合多年公安實踐經驗來看,脣語識別技術能豐富海雲現有的公共安全領域大數據一站式解決方案,使攝像頭卡口數據等異構數據發揮出更大的應用價值,更好的提高公安破案效率。

不過,當前的脣語識別技術還有許多條件限制,如可見度較低的環境下很難進行識別;並且,脣語識別需要驗證者高度配合。指紋識別系統、人臉識別以及虹膜識別的誤識率分別為0.8%、0.3%和0.00001%,脣語識別技術的70%還沒有真正達到成熟應用的時候。

本文為 品途商業評論( http://www.pintu360.com )作者:趙子瀟創作,責編:趙子瀟。歡迎轉載,轉載請註明作者姓名以及原文出處:http://www.pintu360.com/article/137750.html。不註明作者和出處品途商業評論有權追究其責任。本文僅代表作者觀點,不代表品途商業評論觀點。

相關推薦

推薦中...