科大訊飛用AI顛覆錄音筆行業:實時轉寫+分場景降噪+邊錄邊譯

看點:錄音筆這個傳統“工具型”消費電子產品,在AI加持下,煥發出新的生機,從錄音工具轉化為多場景實時“錄音、轉寫”記錄利器。

科大訊飛用AI顛覆錄音筆行業:實時轉寫+分場景降噪+邊錄邊譯


科大訊飛用AI顛覆錄音筆行業:實時轉寫+分場景降噪+邊錄邊譯

智東西5月22日消息,昨日,科大訊飛在上海舉行了年度新品發佈,會上訊飛推出了五款面向終端消費者的AI硬件產品和AI平臺iFLYOS2.0,宣告AI技術進入規模化落地階段。

新品中備受關注的是兩款全新的智能錄音筆產品SR701旗艦版和SR501標準版。在將語音核心技術與最新的硬件、AI技術結合並落地到消費者產品的道路上,訊飛邁入了一個新的疆域,並試圖全面革新錄音筆這個傳統“工具型”消費電子產品,並拓展其應用邊界,讓它從錄音工具轉化為多場景實時“錄音、轉寫”記錄工具。

麥克盧漢說:“媒介是人的延伸”,錄音筆可以看成是人們記憶的延伸。它記錄了人們無法一時記住的全部內容,方便人們進行回放、提取重要信息。1877年愛迪生髮明留聲機標誌著錄音設備的誕生,之後便攜式錄音設備在20世紀中期被髮明,在經歷了幾十年的磁帶式錄音設備的發展階段後,21世紀初開始出現以閃存為存儲媒介的數字錄音筆,SONY、飛利浦成為這一領域的主要玩家。

現在進入AI時代,對數字錄音筆的定義也發生了相應的變化,我們可將其劃分為傳統數碼錄音筆和智能錄音筆。智能錄音筆是基於人工智能技術,集高清錄音、錄音轉文字、雲端存儲等功能為一體的智能硬件,是AI落地應用場景的代表性產品。

科大訊飛用AI顛覆錄音筆行業:實時轉寫+分場景降噪+邊錄邊譯

▲訊飛智能錄音筆正式亮相

作為中國最大的智能語音技術提供商,科大訊飛曾利用其一流的翻譯技術,打造了多款備受關注的翻譯機。如今,訊飛高舉高打,宣佈推出兩款面向中高端市場的智能錄音筆SR501標準版和SR701旗艦版。這兩款錄音筆能分場景使用不同算法對環境進行降噪,讓錄音筆錄制的聲音更清晰。而且,這兩款錄音筆轉寫的準確率高達98%。它們還有邊錄邊譯的功能。

會前,智東西參與了這款內測狀態的智能錄音筆體驗,並與這一產品的“創始人”科大訊飛副總裁兼消費者事業群副總裁李傳剛進行了一次深度對話。通過還原訊飛用一年多時間定義並推出的這樣一款語音+AI智能硬件產品的過程,我們將會看到訊飛團隊如何再造錄音筆這個產品形態,這個市場又會有多大的機會。

科大訊飛用AI顛覆錄音筆行業:實時轉寫+分場景降噪+邊錄邊譯

智能錄音筆到底智能在哪?

李傳剛說,訊飛智能錄音筆是一款專業級的智能錄音設備,它能讓聲音信息的存儲、編輯、轉寫、查看功能更加智能和高效。

科大訊飛用AI顛覆錄音筆行業:實時轉寫+分場景降噪+邊錄邊譯

訊飛錄音筆的智能首先體現在它對語音記錄功能的重新定義:

第一、他們的智能錄音筆可以實現語音轉寫,識別的準確率最高可達98%。而傳統的錄音筆在錄音之後,還要讓用戶花費大量時間去再聽錄音並將其轉為文字。訊飛智能錄音筆還能將轉寫的結果實時呈現在機身全貼合高清觸控屏上。而且,轉寫內容可同步到電腦、平板、手機多終端設備,方便用戶進行編輯。

第二、訊飛智能錄音筆利用人工智能技術分場景對環境中的噪聲進行抑制,能使錄製的人聲更清晰。而傳統的錄音筆很難做到一款產品實現多場景目標聲音和噪聲區隔。

科大訊飛用AI顛覆錄音筆行業:實時轉寫+分場景降噪+邊錄邊譯

▲智能語音筆實時轉寫功能

與搜狗的智能語音錄音筆不同,訊飛的這兩款智能錄音筆集軟硬件於一體,能獨立完成文字轉換全流程,而無需外接其他設備。

而且,通過4G、WIFI等多種網絡連接方式,錄音及轉寫的文本內容可以一鍵分享至微信等社交平臺。

科大訊飛用AI顛覆錄音筆行業:實時轉寫+分場景降噪+邊錄邊譯

▲智能語音筆的系統設置界面

用戶還能通過錄音過程中所打的標籤點,在回放錄音時迅速找到所需要的錄音片段。

李傳剛還介紹,訊飛的智能語音錄音筆具有邊錄邊譯的增值功能,一方面,用戶可以在屏幕上看到翻譯的文本;另一方面,在外接耳機之後,用戶可以聽到錄音筆的翻譯。目前,該功能還需要4G網絡或WiFi的支持。

科大訊飛用AI顛覆錄音筆行業:實時轉寫+分場景降噪+邊錄邊譯


科大訊飛用AI顛覆錄音筆行業:實時轉寫+分場景降噪+邊錄邊譯

▲智能語音筆邊錄邊譯功能

不同於訊飛翻譯機主打多語種對話翻譯,適用於語言不通的各個場景,訊飛智能錄音筆的翻譯功能可以說只是該產品的一個輔助功能,主要用於英文培訓等記錄場景,在轉錄同時進行輔助翻譯。

李傳剛認為訊飛智能錄音筆是一款顛覆型的產品。他說:“萬物互聯時代來臨,比起單一的‘錄音’,用戶更加需要的是多場景的‘智能語音記錄助手’,而訊飛錄音筆正是從功能和體驗上實現了錄音、轉寫、文件管理編輯的一體化。”

科大訊飛用AI顛覆錄音筆行業:實時轉寫+分場景降噪+邊錄邊譯

訊飛智能錄音筆運用了哪些黑科技?

訊飛智能錄音筆最重要的兩大優勢是錄音更加清晰、轉寫的準確率更高。

那麼它們是如何實現這兩點的呢?

科大訊飛用AI顛覆錄音筆行業:實時轉寫+分場景降噪+邊錄邊譯

據李傳剛介紹,訊飛將2顆哈曼定向麥克與6顆矩陣麥克相結合,並利用了遠距離拾音算法和自主研發的降噪算法,能使智能錄音筆達到15米遠距離清晰收音的效果。

科大訊飛用AI顛覆錄音筆行業:實時轉寫+分場景降噪+邊錄邊譯

▲15米遠距離收音

他說:“我們為智能錄音筆設計了六大場景,每一場景都使用了不同的算法來抑制環境中的噪聲。”

以遠場演講場景為例,設備會調用2個定向麥克風拾音,同時6個矩陣式麥克風識別周邊及其他方向反射回來的噪聲,通過算法進行比對消噪,使得錄製的人聲更加清晰。

在近場會議模式下,2個定向麥克風將停止工作,錄音筆將6個矩陣麥克風對收集的信號進行加權算法,在目標信號的方向形成一個拾音波束,同時衰減來自其他方向的噪聲,可以定向拾取與會者的發言,使得錄取到的聲音清晰準確。

科大訊飛用AI顛覆錄音筆行業:實時轉寫+分場景降噪+邊錄邊譯

▲智能語音筆(SR501標準版)的採訪場景

這種分遠場、近場進行拾音降噪的功能,是傳統錄音筆所無法具備的。

訊飛還使用了業界領先的語音識別和轉寫引擎。訊飛自2006年開始提供轉寫服務,其看家本領語音識別則在過去多年不斷精進。面對萬物互聯時代的全新挑戰,訊飛在18年9月包攬了國際多通道語音分離和識別大賽(CHiME)四個項目的冠軍。

同時,智能語音筆中還使用了訊飛自家的TTS語音合成技術,讓翻譯結果實時可聽。

在硬件方面,錄音筆標配2000mAh電池,滿電狀態下可錄音10小時。機身採用CNC航空級鋁合金銑削而成,經過採用噴砂、陽極氧化工藝處理,打造出了高質感的外形。

兩種不同型號的錄音筆在核心功能上相差無二,不過,在硬件配備上稍顯不同。比如,訊飛SR701旗艦版擁有3.5英寸 HD(720*1280)獨立觸摸屏,背板採用0.6mm弧形陶瓷背板;而SR501標準版為3.1英寸 WVGA(480*800)觸摸屏,背板採用0.55mm 機銑玻璃背板;同時兩種型號的智能錄音筆在存儲空間上也有所差異,SR701旗艦版內置32GB機身存儲,同時配備20GB雲端存儲空間,SR501標準版則具備16GB機身存儲和10GB雲端存儲空間。兩款型號錄音筆的具體產品配置如下表所示:

科大訊飛用AI顛覆錄音筆行業:實時轉寫+分場景降噪+邊錄邊譯


科大訊飛用AI顛覆錄音筆行業:實時轉寫+分場景降噪+邊錄邊譯

訊飛挖掘和再造錄音筆新市場

根據市場公開資料預估,傳統的錄音筆全球市場大致有幾千萬,中國大致佔一兩千萬左右。索尼是全球智能語音市場上的最大的玩家,市場份額約佔10%,他們主要以高端智能錄音筆為主,價格大致在1500元以上。飛利浦佔市場份額的15%左右,他們主打中端的智能錄音筆,產品售價在800元到1500元左右。

科大訊飛用AI顛覆錄音筆行業:實時轉寫+分場景降噪+邊錄邊譯

訊飛的SR701旗艦版售價為2999元,SR501標準版售價為1999元。從這兩款產品的售價也可以看出,訊飛的智能錄音筆主要是面向那些對高品質轉寫有需求的用戶。這些用戶可能是蘋果、華為等高端手機的忠實粉絲,也是各個場景的專業記錄者,消費水平較高,並且願意為更高品質的文字轉錄功能付費。

而且,這些用戶也對產品的硬件也有要求,他們希望智能錄音筆有像高端手機一樣的質感,這樣的產品可以更符合他們的身份地位。

經過前期的市場調研,李傳剛說智能錄音筆將會對兩大群體產生重大影響,第一大群體就是記者、學生、執法人員等對錄音有需求的傳統錄音筆群體,新產品對於他們而言相當於升級換代。

第二大群體是對語音轉寫有需求的人,他們之前可能並未使用錄音筆。他舉例說,比如老師有寫書的需求,他們原來會使用APP將語音轉化為文字,然後再修改文字。有了這款產品之後,老師能在課堂上帶著智能錄音筆,實現實時的語音轉寫,及時記錄課堂上閃過的靈感。而且,他們的錄音筆在充滿電後可以連續10小時錄音,不用擔心續航問題。

科大訊飛用AI顛覆錄音筆行業:實時轉寫+分場景降噪+邊錄邊譯

一年時間打造專業級智能錄音筆

作為“骨灰級”AI玩家,訊飛在翻譯和轉寫賽道上具備典型技術優勢。

對比手機上的錄音和轉寫軟件而言,訊飛此次推出的智能錄音筆是獨立的設備,僅處理單任務,能把錄音和實時文字轉化的功能發揮到極致。而手機是一個處理多任務的產品,在錄音、轉寫的同時,有可能還要接電話、社交等,這就影響了任務的處理進程。在中型、大型的會議現場,人們就不能拿手機去錄音。相比之下,這兩款智能錄音筆更為專業。

據瞭解,訊飛智能錄音筆項目硬件團隊目前僅有30多人,他們在市場調研上花費了3個月的時間,從立項到現在推出產品,用時不過1年時間。

在研發過程中,訊飛遇到的挑戰一方面來自於錄音、轉寫、翻譯技術的一體化整合;另一方面在於針對用戶真實需求進行6大場景的錄音和轉寫效果的優化,比如演講、採訪、會議等。

李傳剛在與智東西交流時說,在未來,訊飛智能錄音筆還會搭載更多的黑科技。

科大訊飛用AI顛覆錄音筆行業:實時轉寫+分場景降噪+邊錄邊譯

結語:訊飛轉寫技術進一步落地 智能錄音筆開闢語音記錄新疆域

科大訊飛輪值總裁胡鬱是訊飛消費者業務的操盤手,他非常感概地說:“偉大的技術需要偉大的產品來實現落地。”在過去的20年內不斷實現技術創新對訊飛而言是很重要的,隨著行業、商業社會的重構,進行商業模式的創新對如今的訊飛而言也至關重要。

他說,訊飛智能錄音筆代表著訊飛從源頭核心技術系統創新到產品應用創新的過渡,體現了訊飛正在擁抱全新的商業模式創新。

科大訊飛用AI顛覆錄音筆行業:實時轉寫+分場景降噪+邊錄邊譯

▲李傳剛在發佈現場講解產品

在錄音和轉寫功能落地的嘗試上,訊飛此前已有訊飛聽見會議系統和在線轉寫平臺的良好積澱,而此次訊飛智能錄音筆的全新推出,是科大訊飛將智能轉寫技術放到了一個使用場景更廣、人群更廣的c端市場來落地。

據智東西瞭解,在科大訊飛內部,由胡鬱帶領的消費者業務對2019年的定義是“人工智能價值兌現的一年”,訊飛正在結合自己的翻譯和轉寫兩大技術優勢來佈局自己的消費者業務,不斷將其核心技術轉換成消費者可用的硬件設備。除了智能錄音筆,訊飛其他的相關產品也正在研發當中。

相關推薦

推薦中...