谷歌開源語音命令數據集，幫助開發者搭建基礎的語音交互

機器學習 Google 語音識別深度學習雷鋒網雷鋒網 2017-08-28

谷歌的工程師們經常被問到這麼個問題：

怎麼上手用深度學習做語音識別或其它音頻識別，比如關鍵詞或指令？

雖然，現在出現了些很優秀的開源語音識別系統，比如 Kaldi，就能把神經網絡作為其中的一個模塊。但其高度複雜性，讓它們並不適合作為解決簡單任務的指南。更重要的是，對於新手而言，免費、可公開獲取的數據集並不多，經過預處理的、或適合於簡單的關鍵詞檢測的也很少。

為解決這些問題，谷歌的 TensorFlow 和 AIY 團隊創建了 Speech Commands Dataset，即“語音命令數據集”，並基於它向 TensorFlow 添加訓練和推理的示例代碼。

雷鋒網消息，谷歌在今日宣佈開源該數據集。

對 30 個命令短語，該數據集有 65000 次的長約一秒鐘的發音。這來自數千個不同的人向 AIY 網站提交的貢獻。它以 Creative Commons BY 4.0 許可發佈，隨著新貢獻的添加，該數據集在未來會不斷擴大。

建立這個數據集的目的，是幫助大家為應用創建基礎但有用的語音交互，比如“Yes”、“No”、數字、方向等詞語。谷歌也已經將開發這一數據集的基礎設施開源，並希望看到更多人藉此創建更多版本的數據集，尤其是針對冷門語言和應用。

下載預建的 TensorFlow 安卓演示 APP，打開 “TF Speech”，就能體驗谷歌基於該數據集開發的識別模型。另外，你可以通過 TensorFlow.org 的音頻識別 tutorial 學習怎麼開發你自己的模型。

相關推薦

'谷歌系無人車仿真器公司，剛又融資4000萬美元，面臨開源競爭'

"雷剛發自凹非寺量子位報道 | 公眾號 QbitAI無人車公司哪家強？衡量的要素有很多。但眾所公認的是，能力強大的無人車公司，肯定也是仿真技術做得出色的公司。而且作為無人駕駛研發中舉足輕重的一環，仿真也越來越多受到資本市場追逐。這不，硅谷仿真模擬創業公司Applie...

無人駕駛 Google 投資創業騰訊硅谷人生第一份工作 Y Combinator 機器人 Google地圖工程師雷剛 2019-09-19

'百度超谷歌躍升全球第二，硬核語音技術成搶奪智能音箱“C位”的王牌'

"雷鋒網 AI 科技評論按：日前，據科技市場研究企業 Canalys 發佈的第二季度全球智能音箱市場報告，百度繼今年上一季度超越阿里後，再度超越該行業的“雙寡頭”之一谷歌，成為全球第二大智能音箱供應商。圖源：Canalys 報告在智能音箱這一賽道，相比其他頭部廠商，百度入局...

音箱語音識別技術技術百度 Google 硬件算法人工智能阿里巴巴集團夏日無處不音樂亞馬遜公司 2019-09-02

'百度智能音箱超谷歌躍升全球第二，硬核語音技術成搶奪C位王牌 '

"日前，據科技市場研究企業 Canalys 發佈的第二季度全球智能音箱市場報告，百度繼今年上一季度超越阿里後，再度超越該行業的“雙寡頭”之一谷歌，成為全球第二大智能音箱供應商。圖源：Canalys 報告在智能音箱這一賽道，相比其他頭部廠商，百度入局稍晚，如今卻能力壓群雄取得...

音箱技術語音識別技術百度 Google 硬件算法阿里巴巴集團人工智能夏日無處不音樂 2019-09-02

'山雨欲來風滿樓！華為谷歌和好暫無望，方舟編譯器31號正式開源'

"動口不如親為，求人不如求己。目前，谷歌已經正式宣佈華為未來推出的新款手機，包括華為Mate30，將無法預裝谷歌原生的服務套件。其中包括地圖、應用商店、支付、視頻流、以及雲服務空間等一系列「谷歌全家桶」。並且，華為Mate30只能使用安卓的開源版本，無法升級到最新的安卓系統...

編譯器華為公司 Google 華為手機 Android 操作系統雲計算 2019-09-02

'美聯邦政府利用谷歌數據追查威斯康辛州銀行搶劫案疑犯手機：似乎成效不大'

"據外媒報道，2018年10月13日，兩名男子走進密爾沃基郊外一家大型購物中心的一家Great Midwest銀行。他們是這家銀行開門營業時的頭兩名顧客，當時，他們戴著墨鏡、蓄著濃密的鬍鬚，這使得他們的面貌幾乎認不出來--但很快事情就一目瞭然了。這兩位趕早的“顧客”是來搶劫...

威斯康星州銀行 Google 追捕 Android 技術北卡羅來納州曼哈頓密爾沃基明尼蘇達州 2019-09-01

'谷歌旗下Waymo開源部分自動駕駛數據集'

"谷歌母公司 Alphabet 旗下自動駕駛公司 Waymo 21 日對外宣佈，將對外開放部分其自動駕駛相關數據。Waymo 表示，這些開源的數據集包含 1000 段自動駕駛路徑，每一段包含 20 秒的不間斷自動駕駛視頻，這 20 秒視頻中由 Waymo 的傳感器採集的包含...

無人駕駛 Google 雷達加利福尼亞交通人生第一份工作 Uber 2019-08-31

'谷歌新技術保護隱私數據，廣告主與用戶都不得罪？'

"長期以來，關於廣告主精準投放廣告有可能直接獲取用戶個人信息的事件引發用戶對於個人隱私的擔憂，而現在，谷歌專門為此研發了一種新技術。據外媒報道，谷歌Chrome提出一套新的名為“Privacy Sandbox”技術解決方案，這是一種新的開放式WEB技術，如果與新的API搭配...

Google 瀏覽器 Chrome 技術美國股市中國概念股 2019-08-26

'Waymo開源部分數據集促進自動駕駛場景理解和行為預測研究'

"(圖片來源：Waymo官網)蓋世汽車訊據外媒報道，Waymo宣佈開源其訓練自動駕駛汽車算法的部分數據集Waymo Open Dataset。Waymo首席科學家Dragomir Anguelov 表示，“該數據集由Waymo自動駕駛汽車收集的高分辨率傳感器數據組成。數據...

無人駕駛算法機器學習工程師設計技術硬件機器人騎行軟件舊金山人生第一份工作 2019-08-24

'華為幫助谷歌解決安卓卡慢問題'

"在之前小編簡單科普一下安卓的卡頓問題：首先，安卓是使用Java開發的，Java的跨平臺確實解決了硬件多樣化的問題，但是當你下載了一個軟件安裝的時候需要進行重新編譯。用過第一代安卓手機的朋友都知道也就是2008年發佈開始，Android 1.0時代很慢很卡。因為最開始呢安卓...

Android Google 華為公司編譯器 Android Runtime Java iOS 虛擬機 YunOS 硬件軟件 2019-08-18

'在在大數據時代你的資料洩露給誰了？蘋果、谷歌、騰訊還是百度？'

"三年前，我們起訴了聯想和他的售後第三方，原因是，第三方拿走我們一塊硬盤維修後，先後3個人和我們聯繫，分別是：硬盤丟失-格式化了-返回廠家銷燬，莫衷一是；諮詢聯想，答覆追蹤不到，應該是返回硬盤廠家希捷銷燬了。而那塊硬盤裡，存有上千家企業的股東會決議文件以及其他涉及企業和個人...

大數據百度騰訊 Google 移動互聯網蘋果公司百度地圖 Facebook 銀行不完美媽媽聯想集團 Twitter 法律 Google地圖亞馬遜公司華為公司希捷科技經濟人工智能李彥宏 2019-08-16

'安卓系統是開源的，為什麼總有人認為谷歌可以禁用安卓？'

"題主對安卓“開源”的含義理解有誤，前面的回答大都在談谷歌怎麼賺錢，這跑題跑的，所以我來強答一發。首先說說安卓系統和Linux的淵源。學生時代的Linux之父林納斯.託瓦茲，一點看不出酷炫狂拽的樣子。安卓是基於Linux系統開發的，而Linux是一款免費的操作系統（有GNU...

Android Linux 操作系統 Google GNU 不完美媽媽 FFmpeg 程序員硬件微軟諾基亞軟件 2019-08-11

'遭萬人捶的蘋果，現被谷歌超越，市值重回萬億大關？淨利數據嚇人'

"在微軟、谷歌、亞馬遜後，蘋果也在7月30號發佈了財報信息。自從財報公佈後，蘋果股價便上漲了4.48%，甚至一度達到了218.44美元/股，截至到當天收盤，蘋果市值達到了9606.1億，在美股上市公司中市值排名僅次於微軟。雖然蘋果當季總營收上漲了1%，但淨利卻有所下降，下滑...

iPhone Google 蒂姆·庫克蘋果公司微軟美國股市華為公司經濟 Mac App Store iOS 小米科技亞馬遜人生第一份工作電腦 2019-08-03

'亞馬遜與谷歌攜智能語音助手，強推聲控遊戲'

"當人工智能語音技術愛上游戲智能語音平臺坐擁億萬語音數據之後，將有機會通過大數據將瞭解到人們平時在用智能音箱做什麼。是上鬧鐘，放音樂，還是背唐詩。據亞馬遜語音助手Alexa “首席佈道師”Dan Isbitski 介紹，自2018年以來，數十億的命令要求Alexa玩遊戲。...

亞馬遜公司 Google 電子遊戲技術 Alexa Internet 人工智能音箱人生第一份工作創業不完美媽媽 FLOW 證券投資基金 2019-07-31

'超越亞馬遜、谷歌、微軟，阿里雲飛天大數據平臺的世界第一'

"杭州的雲棲小鎮，樹立著一尊飛天5K紀念碑，記錄了一段阿里云為自研大數據平臺奮鬥的歷史。這座紀念碑的底座，在一側刻著參與“戰鬥”的227個工程師的名字，另一側刻著王堅的一段話：“一群有理想的平凡人經歷了1757個日日夜夜，用生命和熱血寫成代碼，為雲計算開啟了未來之勢。堅持...

阿里雲計算大數據阿里巴巴集團 Google 微軟亞馬遜技術雲計算 Hadoop 高德納集團程序員電腦工程師杭州 2019-07-28

'谷歌承認通過語音助手收集用戶談話內容：僅用於開發'

"三言財經 7月16日消息，據美國知名政治網站The Hill報道，谷歌搜索團隊產品經理大衛·蒙西斯日前證實，谷歌員工和第三方合作商可以通過谷歌智能音箱和語音助手收集用戶談話信息，稱所收集的部分音頻被用於開發語音識別系統，從而更好地適應各種語言、口音和方言。蒙西斯還強調，在...

Google 語音識別技術跳槽那些事兒產品經理音箱 2019-07-19

'自動駕駛、語音交互，李彥宏帶你體驗未來科技'

"2019百度AI開發者大會的熱度還未散去。關注了這場大會的人一定會忍不住問自己“這還是我認識的那個百度嗎？”百度公司創始人、董事長兼CEO李彥宏在大會上分享了百度在AI領域的最新進展：中國首個銀行領域虛擬員工“金融數字人”亮相；小度發佈全球領先的全雙工免喚醒能力；與一汽紅...

李彥宏人工智能無人駕駛百度技術人臉識別跳槽那些事兒 Google Facebook 微軟人生第一份工作機器人 2019-07-18

'亞馬遜、谷歌接連暴雷，AI語音隱私問題凸顯'

"點擊右上角關注我，成為科技圈最靚的仔！智東西（公眾號：zhidxcom）文 | 年年導語：隨著AI語音技術的發展，個人隱私受到了巨大的挑戰，你說的每句話都有可能正在被“偷聽”。智東西7月16日消息，隨著AI語音技術的發展，用戶的語音隱私問題愈加嚴重。不到半年，亞馬遜Ale...

Google 亞馬遜人工智能技術語音識別技術跳槽那些事兒軟件 Alexa Internet Siri 蘋果公司彭博新聞社音樂羅馬尼亞自然語言處理法律 2019-07-17

'谷歌雲遊戲獲4000+開發者申請，但只有20%玩家感興趣'

"據外媒報道，目前谷歌Stadia已經收到超過4000份開發者申請，谷歌稱將通過人工審核方式進行仔細審查，確保這些項目和自家平臺互相搭配，能夠出現良好的“化學反應”。在Stadia平臺發佈產品，開發者必須要考慮Stadia平臺的全新功能，發佈的產品適合谷歌的生態系統。谷歌發...

Google Eurogamer Netflix 設計 2019-07-16

全球應用收入數據公佈：蘋果力壓谷歌一頭，國產廠商成績喜人

移動互聯網和智能手機現在已經非常成熟了，應用相關的行業已經發展起來，並形成了龐大的產業鏈。一直以來，在生態方面，iOS相比安卓會更具優勢，攫取了大量的利潤...

蘋果公司 Google 智能手機移動互聯網 Android iOS 騰訊 Google Play 愛奇藝 2019-07-07

2019百度谷歌微軟AI開發者大會上，智能的雲成主角

文|吳俊宇前麥肯錫資深合夥人理查德·福斯特在《進攻者的優勢》一書中提到：企業界向來都有進攻者和防守者，只有不斷的進攻，懂得運用新方法，去挑戰極限才可能有新...

百度人工智能微軟阿里雲計算 Google 雲計算騰訊雲計算 Azure 騰訊技術阿里巴巴集團 SaaS IaaS IBM 2019-07-04

推薦中...