遭遇“隔屏有耳”質疑的,不止中國流行的手機App,還有國內外近年興起的智能音箱。最新的一例是亞馬遜智能音箱Echo植入的智能語音助手Alexa,被曝有人類人工參與“監聽”。

  4月11日,彭博社發佈調查報道,揭祕了亞馬遜Alexa“監聽”團隊中,這些一直被隱藏的人類員工的工作內容。報道稱,有時候,參與其中的工作人員會聽到用戶私人的聲音片段,如一個女人洗澡時嚴重走調的歌聲,或者一個孩子尖叫著尋求幫助。還有兩名員工甚至稱,他們聽到過他們認為是性侵案的聲音。

  亞馬遜此前從未公開過它會人工聽取用戶和Alexa的私人聊天,也沒有披露過Alexa的語音技術中,部分包括人類參與。7位為該項目工作的員工向彭博社透露了亞馬遜Alexa的這項人工聲音檢查流程。

  亞馬遜的Echo是世界上最流行的智能音箱,它於2014年上市;Echo音箱之後,谷歌也推出了植入谷歌語音助手的Google Home智能音箱,蘋果隨後推出了採用Siri的智能音箱HomePod。在中國,天貓精靈、小度智能音箱、小米AI音箱等設備也紛紛走進了更多用戶家庭。

  如今,很多用戶已經習慣於通過喚醒詞將音箱中的語音助手激活,進而向它提出問題或下達指令,有的智能音箱甚至還能與用戶簡單地聊兩句天。但彭博社的報道提出,智能助手如此“懂你”的背後,可能並不僅僅是人工智能和機器學習,而是有人類員工團隊人工聽取用戶與設備的對話錄音,並幫忙改進算法的結果。

亞馬遜智能音箱有千人監聽團隊:曾聽到性侵案Google Home智能音箱

  亞馬遜千人監聽團隊

  彭博社報道介紹,亞馬遜在全球有數千名工作人員,他們人工聽取和檢查用戶和智能語音助手Alexa的私人對話,目的是幫助Alexa改進語音識別技術。

亞馬遜智能音箱有千人監聽團隊:曾聽到性侵案Echo音箱

  該團隊專門收聽用戶在家中和辦公室裡被Echo音箱抓取的錄音。這些錄音會被轉錄、加上註釋,然後反饋到軟件中,以消除Alexa對理解人類語言的差距,幫助它更好地響應指令。

  亞馬遜在廣告詞中介紹,“Alexa生活在雲端,並且一直越來越聰明”,實際上,和許多需要從經驗中學習的軟件工具一樣,人類也為機器做了不少教學。

  執行這一工作的團隊包括全職亞馬遜員工和合約工,工作地點遍佈世界不同地區,包括波士頓、哥斯達黎加、印度、羅馬尼亞。員工簽署了保密協議禁止公開談論這一項目。

  羅馬尼亞首都布加勒斯特的兩位員工透露,他們一天工作9小時,每班解析多達1000條音頻片段。

  波士頓的一名員工則表示,他為特定的話語,如Taylor Swift,挖掘了累積的語音數據,並對其進行了註釋,以表明這個搜索是指那位歌手。

  私人聲音片段也會被抓取

  智能音箱需要時刻開啟麥克風,以監聽用戶是否說出了喚醒詞、是否在向自己下命令。亞馬遜語音助手Alexa的軟件就被設計為持續記錄音頻片段,聆聽喚醒詞。默認的喚醒詞即為“Alexa”。

  目前的工作流程下,私人的聲音片段也會被設備抓取。

  有時候,工作人員會聽到用戶私人的聲音片段,如一個女人洗澡時嚴重走調的歌聲,或者一個孩子尖叫著尋求幫助。工作人員利用內部聊天室共享文件,解析含糊的單詞,或者是分享搞笑的錄音。

  有時員工還會聽到不安甚至有可能是犯罪的錄音。兩名員工稱,他們聽到過他們認為是性侵案的聲音,當這種事情發生時,他們會在內部聊天室說出來解壓。

  亞馬遜對此表示,員工聽到令人痛苦的事情時,他們有標準流程處理。但是這兩位羅馬尼亞員工表示,他們要求對這類案件進行處理時,被公司告知干預此類事件不是亞馬遜的工作。

  “我們認真對待用戶的個人信息和隱私安全。”亞馬遜發言人在一份電子郵件聲明中稱,“我們只會註釋極小一部分的Alexa錄音樣本,為了改善用戶體驗。如幫助我們訓練語音識別和自然語言理解系統的信息,這樣Alexa可以更好地理解用戶要求,並保證對每個人都能提供好的服務。”

  “我們有嚴格的技術和操作保障,對濫用我們系統的行為採取零容忍政策。員工在工作流程中無法直接訪問能辨別用戶和賬號的信息。我們使用多重驗證來限制訪問,對服務加密,審計我們的工作環境,以對所有信息高度保密。”

  語焉不詳的隱私政策

  亞馬遜在其宣傳和隱私政策的材料中,沒有明確表明Alexa獲取的一些對話錄音是人工來聽,只是在常見問題解答列表中提到了一句“我們使用您對Alexa的命令來訓練我們的語音識別和自然語言理解系統”。

  Alexa的隱私設置中,公司給用戶提供了禁用錄音開發新功能的選項。彭博社看到的截圖顯示,發送給工作人員的Alexa錄音沒有提供用戶的全名和地址,但與用戶的賬戶號、名稱和設備序列號相關聯。

  依賴人類員工填補算法空白的,還有谷歌、Siri

  亞馬遜圓柱形的智能音箱Echo於2014年上市後,很快就因其可以在家中使用智能語音軟件快速流行開來。不久之後,谷歌母公司Alphabet推出了自己的版本Google Home,隨後是蘋果公司的HomePod,在中國也有很多品牌的智能音箱產品。

  據研究機構Canalys的報告,2018年,全球消費者購買了7800萬臺智能音箱,其中數百萬臺通過語音軟件與智能手機上的智能助手進行交互。

  大多數現代語音識別系統依賴於模仿人腦的神經網絡,軟件會通過海量數據進行機器學習,為Echo等其他智能音箱的算法提供可能性的模型。如果用戶問Alexa附近有沒有名叫“希臘某某”的地方,算法會自動知道用戶在尋找希臘餐廳,而不是教堂或社區中心。

  但Alexa也經常犯錯,尤其是俚語、口語、方言和非英語的語言。因此亞馬遜需要僱傭人類員工,幫助填補算法的空白。

  除了亞馬遜之外,實際上,其他品牌的語音助手也都是在人類的幫助下訓練出來的。

  蘋果的Siri也有人類員工的幫助,他們負責評估語音助手對請求的解釋是否與用戶說的相符。根據蘋果安全白皮書,員工檢查的Siri錄音是沒有個人身份信息的,錄音會與一個隨機標識符關聯,存儲六個月,之後這些數據就會被移除隨機標識符,但它們也有可能存儲更長時間以改善Siri的語音識別。

  在谷歌,一些人類員工也可以獲取谷歌助手的音頻片段幫助訓練和改善產品,這些音頻也沒有個人身份信息,並且經過音頻失真處理

亞馬遜智能音箱有千人監聽團隊:曾聽到性侵案


相關推薦

推薦中...