麻省理工開發出低功耗語音識別技術

語音識別人工智能機器學習物聯網人工智能快報 2017-03-28

自動語音識別技術在十多年之前還難登大雅之堂，但現在它正成為人們和主要計算設備之間進行交互的主要手段。

據麻省理工學院報道，該院的研究人員已成功開發出了自動語音識別的低功耗專用芯片。通常人們在手機上啟用一次語音識別軟件需要消耗1瓦左右的電量，而這款新芯片只需消耗0.2到10毫瓦的電量；當然，具體的能耗大小和需要識別的單詞數量有關。

在實際應用中，這可能意味著節約90%到99%的電量，從而使得語音控制可應用到相對簡單的電子設備中；包括電容量有限而需要從其所處環境中吸取能量的設備，以及幾個月才進行電池充電的設備。這些設備是構成“物聯網”（internet of things，IoT）的技術基礎。物聯網的構想是，交通工具、電器裝置、土木工程建築、生產設備、甚至家禽等都會裝上傳感器，這些傳感器會直接將相關信息發送給聯網的服務器，並由後者來協助完成維護保養和任務調度。

“語音輸入會成為很多可穿戴應用和智能設備順理成章的一個接口。”麻省理工學院研究人員表示，“這些設備的小型化必然要求提供不同於觸摸和鍵盤的交互方式。和在雲端進行這類語音操作相比，把語音功能嵌入到這些設備中可以降低能耗，這很關鍵。”

“我認為我們不是為某一特定應用而開發的這門技術。”研究人員補充道，“我們已經努力將這些基礎的功能做到位了，希望能讓系統設計者可以更好地進行設計取捨，這是採用現有的硬件或者軟件加速技術做不到的。”

研究人員在上週（2017年2月5-9日）舉行的國際固態電路會議（International Solid-State Circuits Conference）上發表了關於這款新芯片的論文。

電路喚醒

和其它最先進的人工智能系統一樣，當今性能最好的語音識別系統都基於神經網絡，即根據人腦建模的簡單信息處理器構建而成的虛擬網絡系統。該芯片的很多電路都圍繞著儘可能高效地實現語音識別網絡而設計。

但是，即便是最節能的語音識別系統，如果持續不中斷地運行，也會很快耗光設備的電量。針對這種情況，該芯片也包含了一個簡單的“語音活動檢測”（voice activity detection）電路來監聽環境中的噪聲，以甄別其中是否有人類語音；如果檢測到語音，芯片就會激活更大更復雜的語音識別電路。

實際上，出於實驗目的，研究人員設計的芯片有三個不同的語音活動檢測電路；它們的複雜程度不同，因而能耗也不一樣。哪種電路最節能與使用環境相關，但是在模擬的各種環境測試中，三種電路里最複雜電路所在的芯片總體表現最好。雖然這種電路自身的能耗接近最簡單電路的三倍，但是它的誤檢率要低得多；簡單電路經常誤激活整個芯片，導致整體能耗更高。

一個典型的神經網絡由數千個處理“節點”構成。每個節點只能進行簡單的計算，但節點之間緊密聯結。在常用於語音識別的神經網絡中，節點按層組織。語音數據通過底層輸入神經網絡，這一層的節點對數據進行處理並送入下一層節點，以此類推。頂層的輸出指明語音數據是某個特定語音的概率。

語音識別網絡體積太大，不能載入到芯片的內存裡，問題就來了：從芯片外存儲器中讀取數據到芯片中比從芯片自己的存儲中讀取數據更耗能。針對這一問題，麻省理工學院的研究人員的設計致力於使芯片從芯片外存儲器讀取的數據量最少。

帶寬管理

神經網絡中的一個節點可能從多個節點接受數據，也可能會把數據傳給多個節點。節點之間的這種多向聯結都有自己的權重值。一個聯結的權重值表示從這個聯結來的數據在數據接受節點進行計算時的重要性。減少芯片內存帶寬的第一步就是壓縮每個節點相關的權重值。數據只有放到芯片裡後才會進行解壓。

芯片還利用了語音識別的一個特有性質：一波又一波的數據必須通過網絡。進入的音頻信號都被分成多個10毫秒的增量數據，每一個增量數據都必須單獨進行評估。這種芯片每一次只載入神經網絡的一個節點，但這個節點要傳遞32個連續的10毫秒增量數據。

如果一個節點有12個輸出，那麼這32個傳遞數據便會得到384個輸出值，存放在芯片內存中。當要將這些輸出傳給下一層的節點時，每個輸出值都必然和其它11個值一起進行傳輸，每層都會做類似的處理。因此，該芯片也要求具備一定規模的片上內存電路來進行中間計算。芯片每次只從芯片外存儲器中讀取一個壓縮節點，這樣就保持了較低的能耗需求。

“對下一代的移動設備和可穿戴設備而言，實現語音識別的超低功耗很關鍵。”研究人員表示，“這是因為手錶、耳塞式耳機和眼鏡這類設備小型化趨勢明顯，需要不再依賴觸摸屏的用戶接口。語音是和這類設備進行交互的順理成章的方式。”

相關推薦

'香港科技大學開發出全新的雙層全光學神經網絡'

"導讀據美國光學學會官網近日報道，香港科技大學的研究人員演示了一種全新的多層全光學人工神經網絡，向著實用的大規模光學神經網絡邁出了關鍵一步。背景大腦是人體最重要的器官之一，它支撐著人的視覺、聽覺、平衡、味覺、嗅覺、記憶、情感、學習等。大腦的構造十分複雜，它由大約1千億個神經...

人工智能電腦大學香港技術並行計算香港科技大學設計硬件牛津大學語音識別技術人生第一份工作無人駕駛 2019-09-03

'俄羅斯莫斯科物理技術學院開發出新型二階憶阻器'

"導讀據俄羅斯莫斯科物理技術學院官網近日報道，該校研究人員創造出一種稱為“二階憶阻器”的氧化鉿基新型器件。它可以像大腦中的突觸一樣存儲信息，並逐漸遺忘長時間未被訪問的信息。背景人腦具有極其強大的記憶與計算能力，其複雜程度和處理能力遠遠超過最先進的超級計算機。那麼，大腦中如此...

物理技術電腦俄羅斯莫斯科大學生物格羅寧根大學人工智能南安普敦大學新聞設計 2019-08-31

'美國開發出將氨用於燃料電池的技術'

"1.美國特拉華大學研究團隊開發出一種將氨用於燃料電池的技術微信公眾號：前沿材料近日，美國特拉華大學研究團隊開發出一種將氨用於燃料電池的技術，該研究獲得了美國能源部250萬美元資助。研究發現，作為一種基於氮的液體燃料，氨的儲存和分配比氫更便宜，並且避免了碳排放。為解決氨比氫...

技術新能源汽車蘋果公司能源超級計算機化學新能源利弗莫爾大學中國科學技術大學澳大利亞人工智能潘建偉材料科學電腦加利福尼亞投資量子計算理論三星集團智能手機 2019-08-28

'騰訊車載微信發出語音消息第一天'

"目前產業競爭的主賽場正在由“單打”PK逐漸變為“雙打”比賽。實體產業的競爭不再是單打獨鬥，各個實體產業正在與信息產業結合，形成新搭檔來參與競爭。8月26日，2019中國國際智能產業博覽會在重慶隆重開幕，騰訊公司董事會主席兼首席執行官馬化騰出席峰會並致辭，長安汽車跨界攜手騰...

騰訊微信騰訊雲計算技術長安汽車移動支付馬化騰人工智能長安音樂通信重慶操作系統 2019-08-28

'FAIR提出大規模細粒度詞彙級標記數據集LVIS，有效識別長尾分佈'

" 記得關注呀From:FAIR 編譯:T.R聚焦於關鍵科學問題的數據不斷促進著目標檢測領域的技術進步，使得目標檢測的性能從簡單的圖像擴展到了複雜的場景，從邊框標註拓展到了語義分割掩膜。近日來自facebook AI研究院的研究人員們又發佈了一個大規模的詞彙實例分割數據集(...

人工智能算法技術設計玩具眾包 2019-08-24

'搜狗推“個性化語音識別”，將顛覆與改變未來人機交互模式'

"專業機構發佈《2019年語音技術》報告稱，語音將成為未來十年決定性主題之一，與人工智能一起從根本上改變人與機器的關係。近日，搜狗輸入法在語音輸入領域率先推出“個性化語音識別”功能，突破語音識別技術瓶頸，大幅優化個人詞彙錄入的直接準確性，在語音輸入領域實現“更懂用戶”。搜...

語音識別技術搜狗人機交互技術人工智能搜狗拼音輸入法輸入法移動互聯網虛擬現實 2019-08-19

'Facebook又被爆出監聽用戶語音通話'

"8月14日，Facebook又被爆出監聽用戶語音通話的負面消息，承認其僱傭了外部承包商，將Messenger錄下來的用戶對話語音轉抄為文字，而Facebook對此行為的解釋是通過轉錄對話，以評估工具的準確性。同時Facebook還強調這些語音來源是完全匿名的，並且都獲得了...

Facebook 美國證監會馬克·扎克伯格福布斯跳槽那些事兒人工智能 2019-08-17

'搜狗發佈“個性化語音識別”，能知人善察你的每句口頭禪'

"《2019年語音技術》報告內容顯示：語音是未來十年決定性主題之一，將與人工智能一起從根本上改變人與機器的關係。最近，搜狗輸入法在語音輸入領域率先推出“個性化語音識別”功能，在語音輸入領域實現“更懂用戶”。不僅解決了語音識別的技術難題，而且還明顯提升了個人詞彙錄入的準確性。...

語音識別技術搜狗技術搜狗拼音輸入法人工智能輸入法移動互聯網 2019-08-16

'人工智能之語音識別(ASR)'

"人工智能之語音識別(ASR)，AI產品經理必須知道的語音識別技術原理！語音識別（Automatic Speech Recognition，簡稱ASR），是語音交互中最基礎的一個AI技術環節，常見的如siri，智能音箱等。一、核心概念1、語音識別（Automatic Spe...

語音識別技術人工智能 Siri Google 算法 Word 技術音箱輸入法產品經理 Alexa Internet 2019-08-08

'離線語音識別技術為啥也要蹭AIoT的熱度？'

"智能家居作為物聯網最重要的應用場景之一被越來越多的用戶所認可。特別是語音識別等人工智能技術的融入將智能家居帶入A-IoT時代。但在一些應用場景下，智能家居的簡單操控並不需要聯網控制，為了能夠實現更好的人機交互，由用戶本地操控將更加方便，因此離線語音技術也為用戶體驗增色不少...

語音識別技術技術算法智能家居人工智能硬件物聯網人機交互軟件深度學習上海深圳 2019-08-08

'微信快手推出視頻版“看一看”；美國開發出可遠程控制的機器人'

"實在智能今日推薦：微信聯合快手推出視頻版“看一看”；微博近日公佈了頭部作者數據；蘇寧體育將在未來2-3年開啟上市計劃；美國未來十年內將會分發超過200億美元的通用服務基金……微信聯合快手推出視頻版“看一看”騰訊投資或收購快手的事情還沒有眉目，但是雙方的深度合作已經悄悄展開...

微信機器人蘋果公司體育微博人生第一份工作阿里巴巴集團獵聘網上海證券投資基金人工智能深圳騰訊 2019-08-08

'我國科學家開發出新型類腦芯片'

"來源:科技日報來自清華大學等單位的研究人員開發出全球首款異構融合類腦計算芯片。該芯片結合了類腦計算和基於計算機的機器學習，這種融合技術有望發揮基於計算機科學的人工神經網絡和基於神經科學的脈衝神經網絡的優勢，促進人工通用智能的研究和發展。原則上，一個人工通用智能系統可以執行...

人工智能算法神經科學技術電腦清華大學 2019-08-05

'我國科學家開發出新型類腦芯片'

"科技日報記者陸成寬來自清華大學等單位的研究人員開發出全球首款異構融合類腦計算芯片。該芯片結合了類腦計算和基於計算機的機器學習，這種融合技術有望發揮基於計算機科學的人工神經網絡和基於神經科學的脈衝神經網絡的優勢，促進人工通用智能的研究和發展。原則上，一個人工通用智能系統可...

人工智能技術神經科學算法電腦清華大學無人駕駛 2019-08-05

'我國科學家開發出新型類腦芯片'

"來自清華大學等單位的研究人員開發出全球首款異構融合類腦計算芯片。該芯片結合了類腦計算和基於計算機的機器學習，這種融合技術有望發揮基於計算機科學的人工神經網絡和基於神經科學的脈衝神經網絡的優勢，促進人工通用智能的研究和發展。原則上，一個人工通用智能系統可以執行人類能夠完成的...

人工智能技術算法電腦神經科學清華大學無人駕駛法務金融自行車通信 2019-08-05

'美國密歇根大學開發出全球首個可編程憶阻器計算機'

"科技戰略美國國會議員提出一項保護美國政府供應鏈安全的法案據ZDNET網站7月31日消息，美國國會議員提出一項保護美國政府供應鏈安全的法案。該法案名為“製造、投資和知識產權、供應及計算機硬件控制審查法案”（MICROCHIPS），提議美國建設國家供應鏈安全中心及中央清算所機...

電腦思科系統密歇根大學日本人工智能雲計算大學世界衛生組織跳槽那些事兒技術本田技研工業艾滋病 Twitter 設計藥品網絡安全黑客紐約時報 ElasticSearch 硬件甲骨文公司數據庫知識產權農產品人生第一份工作 2019-08-04

'中國開發出全球首款異構融合類腦計算芯片—“天機芯”'

"由清華大學施路平團隊發佈的研究成果——類腦計算芯片“天機芯”登上最新一期的《自然》雜誌封面，基於此研究成果的論文“面向人工通用智能的異構天機芯片架構”(Towards artificial general intelligence with hybrid Tianjic ...

人工智能神經科學電腦算法技術 GPU IBM 2019-08-04

'大眾開發自動駕駛汽車無人充電服務將率先在北美推出'

"文：懂車帝App原創魏微8月2日，據外媒報道，大眾汽車旗下從事充電業務的子公司Electrfy America宣佈，該公司已與舊金山電動車車隊充電公司STABLE AUTO汽車公司簽署了一項協議，為未來的自動駕駛汽車創造自動充電解決方案。該項目將在舊金山市中心的一個試點...

大眾汽車無人駕駛電動汽車福特汽車人生第一份工作軟件投資 BMW 技術歐洲舊金山人工智能 2019-08-04

'語音識別再惹爭議，拿什麼保護我們的隱私安全？'

"智能音箱正藉助AI的力量入主我們每一個人的家庭，可最近，它卻惹出了不少麻煩。美國當地時間7月11日，谷歌對外承認了其讓承包商收聽由谷歌虛擬助手記錄的用戶音頻。無獨有偶，今年4月，亞馬遜智能音箱Echo也被曝出隱私問題。你是否想過，入主客廳的智能音箱正在悄悄記錄你的一言一行...

技術音箱語音識別技術信息安全 Google 人工智能亞馬遜 Alexa Internet 智能手機算法區塊鏈雲計算跳槽那些事兒小米科技黑客 Facebook 百度 2019-07-17

'Valve推出Steam Labs，向用戶展示3款正在開發的項目'

"編譯/Shannon大多數情況下，Valve在開發項目時都會非常保密。但該公司似乎開始慢慢公開其正在開發項目的消息，例如Knuckles（現在稱為Valve Index）控制器的開發。今天，他們繼續推出Steam Labs，Steam用戶可在其中看到實驗性功能並進行測試。...

Steam 維爾福電子遊戲鼠標人工智能虛擬現實 2019-07-17

'百度錢晨談小度智能音箱：從設計上也能提高語音識別能力'

"三言財經7月12日消息，近年來，智能音箱作為“語音交互入口”，越來越受到大眾的歡迎。根據國際數據公司(IDC )發佈的《IDC中國智能家居設備市場季度跟蹤報告》顯示，百度的智能音箱產品一季度出貨量為340萬臺，已位列國內市場第一。而這據其去年三月發佈第一款產品，僅僅過去一...

音箱語音識別技術設計智能家居百度技術工業設計算法人工智能硬件藝術 2019-07-16

推薦中...