'亞馬遜、谷歌接連暴雷，AI語音隱私問題凸顯'

Google 亞馬遜人工智能技術語音識別技術跳槽那些事兒軟件 Alexa Internet Siri 蘋果公司彭博新聞社音樂羅馬尼亞自然語言處理法律智東西 2019-07-17

點擊右上角關注我，成為科技圈最靚的仔！

智東西（公眾號：zhidxcom）文 | 年年

導語：隨著AI語音技術的發展，個人隱私受到了巨大的挑戰，你說的每句話都有可能正在被“偷聽”。

智東西7月16日消息，隨著AI語音技術的發展，用戶的語音隱私問題愈加嚴重。不到半年，亞馬遜Alexa（亞馬遜智能語音助手）和Google Assistant（谷歌智能語音助手）相繼被爆洩露用戶語音信息，有些甚至是語音助手未被喚醒的情況下錄製的用戶語音。

亞馬遜和谷歌在全球僱傭數千名員工專門審查和分析這些用戶錄音，它們的目的是為AI語音訓練收集素材從而讓AI更“聰明”。通過這些錄音，有心之人可以定位你的身份、住址甚至是更私密的個人信息。在AI語音技術發展的過程中，隱私問題日益凸顯。

目前各國已經開始意識到互聯網時代公民的隱私問題，並相繼醞釀出臺了相關的隱私法案。不過AI語音等新技術的發展給各國法律不斷提出新的挑戰，如何進行更有效的隱私保護仍然是一個待解的問題。

一、AI語音技術上演“竊聽風雲”

今年4月11日，彭博社披露了亞馬遜在全球僱傭數千名員工，收聽Echo用戶家中和辦公室錄製的對話。這些員工由亞馬遜正式員工和承包商組成，他們簽署了保密協議被禁止公開談論這件事。

據彭博社文章，亞馬遜布加勒斯特（羅馬尼亞首都）辦事處的兩名工作人員說，他們每天工作9小時，每位員工每班解析多達1000個音頻片段，這個辦事處佔據了羅馬尼亞首都Globalworth大樓的前三層，但外面並沒有明顯的亞馬遜標誌。

無獨有偶，7月12日，谷歌也被披露通過Google Assistant記錄用戶語音信息併發送給人類進行審查。據比利時廣播公司VRT NWS稱，內置Google Assistant的設備正在記錄用戶的對話和聲音，更可怕的是，超過1000個錄音已經遭到洩露。

VRT NWS聽了超過一千個錄音片段，發現這些錄音包含用戶的家庭對話、電話錄音和更私密的對話信息，換句話說，在你以為的私密環境中談論的內容其實已經被錄音並被用於分析。

更嚴重的問題是，AI語音技術造成的隱私洩露問題遠不止於此。

現在越來越多的人使用內置了智能語音技術的軟件，大家會通過這些軟件玩遊戲、購物、搜索音樂和使用電子地圖等。

當你用這些軟件搜索或瀏覽特定內容的時候，你會發現在其他軟件上也能看到類似的內容甚至是與內容有關的廣告。

讓人意外的是，即使你沒有使用這些軟件，而只是在日常生活中談論了類似的內容，當你打開這些軟件的時候也可能會看到相關的內容或者收到推送的廣告。

例如你可能和朋友談到中午想吃炸雞，當你打開外賣軟件的時候你可能就會看到推薦頂部恰巧顯示了炸雞店，或者談到想購買某個物品，那麼當你打開購物軟件的時候可能就會收到這種物品的店鋪推薦或物品廣告。

這些問題的出現可能是有意的也可能只是偶然，但不管怎樣，隨著AI語音技術的發展，用戶的個人隱私正面臨愈加嚴峻的挑戰。

二、收集用戶數據為訓練AI

按照亞馬遜、谷歌和其他智能語音提供商的說法，蒐集的用戶錄音只被用來訓練AI語音系統，使之能夠理解用戶發出的語音命令。

“我們認真對待客戶個人信息的安全和隱私，”亞馬遜發言人在一封電子郵件聲明中表示。“我們只會標註一小部分Alexa錄音，以便改善客戶體驗。這些信息有助於我們訓練語音識別和自然語言處理系統，這樣Alexa可以更好地瞭解您的請求，並確保服務適合每個人。”

與亞馬遜的Alexa非常相似，谷歌也會收集一些Google Assistant的錄音並將其轉錄成文本。谷歌曾保證，只有一部分人能夠接觸這些錄音，且只會被用來訓練和改進AI語音系統，所有這些錄音都不關聯用戶身份信息並且都已經做了失真處理。

但據VRT NWS的調查，洩露的錄音有一部分是在Google Assistant沒有被喚醒的情況下錄製的，並且部分錄音能夠關聯到用戶的身份信息，谷歌將之歸因為智能語音助手的“誤喚醒”（false accept）。

“很少有內置Google Assistant的設備會遇到我們所說的’誤喚醒’，”谷歌的用戶隱私與數據產品經理David Monsees說到。“這意味著背景中存在一些噪音或談話，我們的軟件將之理解為喚醒詞（如“Ok Google”）。我們有一些保護措施，以防止在您家中發生錯誤接受。”

與谷歌和亞馬遜類似，蘋果的Siri也有人工助手，他們負責判斷Siri對用戶命令的解釋是否與用戶所說的一致。據蘋果安全白皮書稱，他們審查的錄音不關聯用戶個人識別信息，並與一個隨機標識符綁定存儲6個月。之後，數據將從隨機識別信息中剝離出來，但可能會存儲更長的時間，以提高Siri的語音識別能力。

三、企業承諾保護隱私但用戶不信任

在被彭博社曝光之後，亞馬遜發言人通過電子郵件寫道：“對內部工具的訪問受到高度控制，並且僅授予有限數量的員工，他們需要這些工具來處理極少量的交互樣本，從而培訓和改進智能語音服務。”“我們的政策嚴格禁止員工出於任何其他原因訪問或使用用戶數據，我們對系統的濫用採取零容忍政策。”

谷歌的David Monsees於洩漏事件發生後在博客中寫道“我們正在對這個領域的保障措施進行全面審查，以防止這種不當行為再次發生。”“在產品開發中，我們秉持高標準的隱私和安全守則，並讓我們的合作伙伴也遵守這些標準。我們還為您提供管理帳戶中存儲數據的工具，您可以完全切斷將音頻數據存儲到Google帳戶，也可以選擇每3個月或18個月後自動刪除數據。”

雖然智能語音技術提供商表達了對於隱私保護的決心和方案，但用戶對於智能語音技術還是充斥著擔憂和防備，尤其擔心智能語音設備會偷聽他們的講話並進行錄音，誰也不想自己的個人隱私被公之於眾。

根據微軟在今年4月23日發表的一份報告顯示，41％的智能語音助手和智能語音技術用戶表達了對信任、隱私和被動聆聽的擔憂。

亞馬遜曾發起過一項叫Alexa for Hospitality的計劃，將Echo音箱放入酒店客房，以便為客人提供服務。但根據Travel Weekly的消息，Best Western酒店首席執行官David Kong說這些設備的使用率很低，大多數客人在進入他們的房間時都會斷開連接。

四、保護隱私成共識，隱私立法仍落後

作為當下全球炙手可熱的高新技術，AI語音技術及相關產品正飛速發展，並逐漸深入人們的日常生活。

據Canalys發佈的2019年一季度全球智能音箱產品統計報告顯示，2019年一季度全球智能音箱產品出貨量相比2018年一季度增長了131.4%達到2070萬臺，全球智能音箱安裝量將自2018年的1.14億臺上升到2019年的2.079億臺，同比增長82.4%，中國內地將成為今年全球增長最快的市場。

不過，AI語音技術和相關產品的高速發展更加凸顯了隱私問題的嚴重性。隨著越來越多的智能語音設備進入人們的生活中，人機語音交互會變的更加頻繁，交互內容也會更加多樣，如果目前的隱私現狀不能得到改善，這無疑會成為一顆隨時可能引爆的地雷。

2018年5月25日，歐洲《通用數據保護條例》（GDPR）生效，條例規定用戶數據收集方必須清楚地披露收集的任何數據，聲明數據處理的合法基礎和目的，保留數據的時間以及是否與任何第三方或歐盟以外的國家共享數據。條例還規定用戶有權刪除自身數據，如果數據洩露對用戶隱私產生不利影響，企業必須在72小時內報告任何數據洩露。2019年1月21日，谷歌被曝因違反GDPR被法國國家數據保護委員會處以5000萬歐元的罰款。

2015年10月，美國聯邦通過《網絡安全信息共享法》，在《隱私法》的基礎上進一步規定了個人隱私、自由等私權利的保護。不過，美國也在醞釀出臺更嚴格的全國性的隱私保護法案。今年2月27日，美國參議院提出《數據隱私法案》；3月14日，美國參議院提出《2019年商業人臉識別隱私法案》提案；4月11日，美國參議院提出《隱私權利法案》等。

2016年11月7日，中國全國人大常委會頒佈《中華人民共和國網絡安全法》，首次從立法層面對個人信息進行了定義和不完全列舉。除此之外，世界上還有許多國家也在相繼推進自己的隱私立法。

目前，關於個人隱私的保護立法各國都有推進，有的已經出臺，有的還在起草醞釀階段，這對消費者隱私保護來說是一個好消息。但是，由於技術日新月異，新技術的發展不斷為各國隱私立法帶來新的挑戰，這時法案的補充、更新就顯得尤為重要。

結語：隱私洩露為AI語音發展敲響警鐘

雖然谷歌、亞馬遜等廠家一再強調不會濫用用戶數據並進行嚴格地保護，各國也相繼出臺了自己的個人隱私保護法案，但問題是用戶數據洩露還是成為了現實，這為AI語音產業的發展敲響了警鐘。

用戶不願看到AI帶來便利的同時也帶來信息洩露的困擾，用戶更不能容忍為了訓練AI而被“偷聽”。就像許多新技術一樣，AI發展的過程伴隨著問題產生的過程，只不過這次遇到的，是嚴峻的隱私問題，隱私無小事。

沒人願意因為使用AI新技術而洩露個人信息，在AI技術的發展過程中，如何更有效的保護用戶的信息是所有人需要思考的問題。