'跟黑灰產大戰五百回合,阿里進化出“安全AI”大腦'

"

人在江湖飄,哪有不挨刀。

作為一名有11年經驗的資深剁手黨,手起刀落,咱們也是參與了N多億萬項目的社會人(雙11、618、520。。。)。雖然,現在雷鋒網編輯小李已經練成火眼金睛,但是也經歷過那麼幾個“沮喪”時刻。

2008年,我打開了第一張新世界的大門:在淘寶上買了一雙傳說是耐克dunk sb新款的鞋,收到之後,得瑟了半天,眼尖的室友尖叫一聲:不對,你的對勾好像反了。。。。奉行“貧窮我就暫時性失明”的宗旨,我還是開開心心地穿了一個星期,然後在體育課上華麗麗地跑掉了鞋底。。。。

自此,那雙辣眼睛的對勾“耐克”就成了剁手党進階路上無時無刻提醒我的“路標”:注意假貨,還有。。。多賺錢。

"

人在江湖飄,哪有不挨刀。

作為一名有11年經驗的資深剁手黨,手起刀落,咱們也是參與了N多億萬項目的社會人(雙11、618、520。。。)。雖然,現在雷鋒網編輯小李已經練成火眼金睛,但是也經歷過那麼幾個“沮喪”時刻。

2008年,我打開了第一張新世界的大門:在淘寶上買了一雙傳說是耐克dunk sb新款的鞋,收到之後,得瑟了半天,眼尖的室友尖叫一聲:不對,你的對勾好像反了。。。。奉行“貧窮我就暫時性失明”的宗旨,我還是開開心心地穿了一個星期,然後在體育課上華麗麗地跑掉了鞋底。。。。

自此,那雙辣眼睛的對勾“耐克”就成了剁手党進階路上無時無刻提醒我的“路標”:注意假貨,還有。。。多賺錢。

跟黑灰產大戰五百回合,阿里進化出“安全AI”大腦

2012 年雙 11 開啟,開心的我認認真真地在購物車囤了一個星期的貨,只待零點,結果零點的鐘聲響起,我還沒反應過來,提交訂單時就遭遇了崩潰——怎麼一下就被搶光了?跟我眼光一致的人這麼多?

那時,命運給我上了一堂我自己還沒搞明白的課:原來還有種東東叫做“秒殺神器”。再到以後,我苦練搶購絕技,卻發現雖然和我一樣的剁手黨越來越多,但踩的坑越來越少。

直到有一天,阿里安全一個做人工智能研究的專家告訴我,他們有個系統,這個系統裡的圖片數據總量相當於 186 箇中國國家圖書館藏量,累積的打假圖片樣本量超過 137 億張。以前他們阿里小二人肉對比打假,吭哧吭哧地幹活,卻怎麼也追不上淘寶發展的速度,現在他們讓 AI 小二上陣,人工查看1張圖片的信息需要 10 秒,5 萬人同時工作的效率才能勉強趕上“知產保護科技大腦(AI 小二)”掃描甄別圖片的速度。

除了打假,他們還靠 AI 打擊黃賭毒,在搶購節點圍追堵截幹壞事的機器人,並抗擊圖謀不軌,準備趁機搞破壞的攻擊者。

"

人在江湖飄,哪有不挨刀。

作為一名有11年經驗的資深剁手黨,手起刀落,咱們也是參與了N多億萬項目的社會人(雙11、618、520。。。)。雖然,現在雷鋒網編輯小李已經練成火眼金睛,但是也經歷過那麼幾個“沮喪”時刻。

2008年,我打開了第一張新世界的大門:在淘寶上買了一雙傳說是耐克dunk sb新款的鞋,收到之後,得瑟了半天,眼尖的室友尖叫一聲:不對,你的對勾好像反了。。。。奉行“貧窮我就暫時性失明”的宗旨,我還是開開心心地穿了一個星期,然後在體育課上華麗麗地跑掉了鞋底。。。。

自此,那雙辣眼睛的對勾“耐克”就成了剁手党進階路上無時無刻提醒我的“路標”:注意假貨,還有。。。多賺錢。

跟黑灰產大戰五百回合,阿里進化出“安全AI”大腦

2012 年雙 11 開啟,開心的我認認真真地在購物車囤了一個星期的貨,只待零點,結果零點的鐘聲響起,我還沒反應過來,提交訂單時就遭遇了崩潰——怎麼一下就被搶光了?跟我眼光一致的人這麼多?

那時,命運給我上了一堂我自己還沒搞明白的課:原來還有種東東叫做“秒殺神器”。再到以後,我苦練搶購絕技,卻發現雖然和我一樣的剁手黨越來越多,但踩的坑越來越少。

直到有一天,阿里安全一個做人工智能研究的專家告訴我,他們有個系統,這個系統裡的圖片數據總量相當於 186 箇中國國家圖書館藏量,累積的打假圖片樣本量超過 137 億張。以前他們阿里小二人肉對比打假,吭哧吭哧地幹活,卻怎麼也追不上淘寶發展的速度,現在他們讓 AI 小二上陣,人工查看1張圖片的信息需要 10 秒,5 萬人同時工作的效率才能勉強趕上“知產保護科技大腦(AI 小二)”掃描甄別圖片的速度。

除了打假,他們還靠 AI 打擊黃賭毒,在搶購節點圍追堵截幹壞事的機器人,並抗擊圖謀不軌,準備趁機搞破壞的攻擊者。

跟黑灰產大戰五百回合,阿里進化出“安全AI”大腦

曾經,無數安全從業者告訴我——“感受不到的安全就是真的安全”“什麼都沒發生就是好事”,我總無法感同身受,但是說到“買買買”,我突然就理解了。

8 月 28 日,阿里巴巴集團安全首席算法專家陸全霹靂吧啦說了一堆,大意是上面 AI 能幫我們順利“買買買”的東西其實就是阿里巴巴商業操作系統的風控大腦,也叫做“安全AI”。

我突然又不懂了,“安全AI”除了讓我們這種吃瓜群眾能感受到順利地“買買買”,背後還有什麼黑科技?跟雷鋒網一起了解一下。

“看到”假貨

為了便於理解,我們還是從特別實操的“如何讓你不買到假貨”說起。

阿里的技術人員是怎麼看哪些是“侵犯了知識產權”的商品呢?

對比圖片,對比款式,對比商標。

但是,不是所有商家上傳圖片時,都是“正正經經‘立正’商標拍照”,有些人只露出商標的一部分,有些是擺出不同的角度,還有一些人故意遮擋。對付文字就更“精明瞭”,他們可能使用變形的文字,並充分利用漢字博大精深的特點。

後來,可以上視頻代替圖片後,有些商家就更厲害了——在很多幀圖片裡上傳一張“隱晦”圖片。

陸全在聊天之前先給我放了一段視頻:仿冒商家在一件正品連衣裙上做了很簡單的樣式改動,比如加了一個蝴蝶結,都能被認出來。

這就要依賴上述打假樣本庫和相關算法。

有意思的是,陸全告訴雷鋒網,現在已經不是採取“敵動我跟”的單點對抗策略,比如,不僅是出現了假貨,收集假貨特徵,被動跟隨打擊,他們會主動尋找假貨特徵,甚至整個黑產的情況,綜合多方面信息“摸底打擊”。甚至在違規商戶只是打算上架“假貨”時,都能精準“擊斃”。

在這樣的背景下,依靠 AI 在商品發佈環節,96%的造假都能被攔截,在修改的過程中不斷檢測和控制,最後能達到每一萬筆中,只有1.1筆被消費者懷疑為假貨。

這種圖片審核和視頻審核背後所採用的 AI 是阿里提出來的“安全AI”大腦的感知區,這個感知區域的核心技術是計算機視覺技術及語音識別技術,是整個系統的感官系統,是對象識別的基礎,為形成後續一系列處理動作邁出第一步。

說白了,“感知區”就是一雙“眼睛”。

剛才“抗擊假貨”只是其中一個應用場景。“眼睛”還有用於線上商品識別的商標檢測、物體檢測、光學字符識別技術,用於營銷環節檢測的廣告圖片分析和視頻直播監測技術,以及用於原創作品保護的多媒體檢索和圖像水印技術等。

如果你要開個店,“眼睛”還要對用於開店身份進行人臉識別、聲紋識別、活體檢測等生物識別。

“眼睛”給線下零售提升效率

不僅是線上,另一個與感知的“眼睛”有關的重要場景是:阿里開設的新零售——線下泛安全場景的保護以及提升效率。

之前有個笑話,說現在小偷已經無錢可偷——因為大家都用電子支付工具,帶個 500 塊現金出門都筭“身懷鉅款”。現在,小偷不僅無錢可偷,可能連實體商品都難以“作案”了。

傳統門店抓小偷的鏈路是這樣的:從錄像看這些貨哪些被人拿走,發現之後,還要看這個人還拿了其他哪些貨。確定之後,要找到這個人正面照片,把照片打印出來再分發給保安。整個回溯錄像和偷竊人的照片的過程,可能需要12-24小時。

如果說“安全AI” 完全替代保安、店員確實是危言聳聽,但它能顯著提升效率。原來線下商店每天需要花 2 小時盤貨,現在可以實時盤貨,原來對丟貨要進行12-24小時的盤貨,現在AI盤貨只需要2個小時。

到底是怎麼做的?

“線下店面現在毛利率很低,你肯定不能通過改造硬件成本提高他們的成本。”雖然陸全看上去是高大上的算法專家,但是考慮用戶需求很實際,那就只有一個辦法,從 AI 算法上改進。

“這些線下店如果採用的是無人店的技術,就會裝貨架攝像頭,對同一個物品有多維去展現,很容易知道這個物品的定位在哪裡,但是一般的監控攝像頭很難知道一個平面的多維度,有可能商品的位置在這兒,實際有很大的偏差,從攝像頭角度,商品的位置已經被挪動,這就要解決二維到三維的問題,我們解決的方式是要對其中很多點事先做多維定位,這樣消耗的是算力資源,比硬件成本要低很多。”

這樣下來,“安全AI” 就知道到底哪些人真的在偷盜,從而實現預警和跟蹤。

一個有意思的數據是,傳統打印慣偷照片分發給保安的情況下,抓住慣偷的概率只有5%,讓 AI上了以後,這個概率能提升到 35%,但是一段時間後,概率大幅下降,原因是,小偷不敢來了。

它不會讓你找出白百合、楊臣剛和C杯

“看見”只是第一步,作為一個有“腦子”的阿里商業風控還需要“認知”。“安全 AI 認知層”的核心技術是自然語言處理技術。

再回到線上場景,如果要對抗購物節和我搶熱銷商品的那麼多機器人,“安全 AI”可以做點什麼?

第一個案例就是“問答式驗證碼”,這是平常我們進行賬戶驗證時時不時會遇到的“關卡”。

以前,我們吐槽過這些逆天的“驗證碼”:

請找出圖中的白百何

"

人在江湖飄,哪有不挨刀。

作為一名有11年經驗的資深剁手黨,手起刀落,咱們也是參與了N多億萬項目的社會人(雙11、618、520。。。)。雖然,現在雷鋒網編輯小李已經練成火眼金睛,但是也經歷過那麼幾個“沮喪”時刻。

2008年,我打開了第一張新世界的大門:在淘寶上買了一雙傳說是耐克dunk sb新款的鞋,收到之後,得瑟了半天,眼尖的室友尖叫一聲:不對,你的對勾好像反了。。。。奉行“貧窮我就暫時性失明”的宗旨,我還是開開心心地穿了一個星期,然後在體育課上華麗麗地跑掉了鞋底。。。。

自此,那雙辣眼睛的對勾“耐克”就成了剁手党進階路上無時無刻提醒我的“路標”:注意假貨,還有。。。多賺錢。

跟黑灰產大戰五百回合,阿里進化出“安全AI”大腦

2012 年雙 11 開啟,開心的我認認真真地在購物車囤了一個星期的貨,只待零點,結果零點的鐘聲響起,我還沒反應過來,提交訂單時就遭遇了崩潰——怎麼一下就被搶光了?跟我眼光一致的人這麼多?

那時,命運給我上了一堂我自己還沒搞明白的課:原來還有種東東叫做“秒殺神器”。再到以後,我苦練搶購絕技,卻發現雖然和我一樣的剁手黨越來越多,但踩的坑越來越少。

直到有一天,阿里安全一個做人工智能研究的專家告訴我,他們有個系統,這個系統裡的圖片數據總量相當於 186 箇中國國家圖書館藏量,累積的打假圖片樣本量超過 137 億張。以前他們阿里小二人肉對比打假,吭哧吭哧地幹活,卻怎麼也追不上淘寶發展的速度,現在他們讓 AI 小二上陣,人工查看1張圖片的信息需要 10 秒,5 萬人同時工作的效率才能勉強趕上“知產保護科技大腦(AI 小二)”掃描甄別圖片的速度。

除了打假,他們還靠 AI 打擊黃賭毒,在搶購節點圍追堵截幹壞事的機器人,並抗擊圖謀不軌,準備趁機搞破壞的攻擊者。

跟黑灰產大戰五百回合,阿里進化出“安全AI”大腦

曾經,無數安全從業者告訴我——“感受不到的安全就是真的安全”“什麼都沒發生就是好事”,我總無法感同身受,但是說到“買買買”,我突然就理解了。

8 月 28 日,阿里巴巴集團安全首席算法專家陸全霹靂吧啦說了一堆,大意是上面 AI 能幫我們順利“買買買”的東西其實就是阿里巴巴商業操作系統的風控大腦,也叫做“安全AI”。

我突然又不懂了,“安全AI”除了讓我們這種吃瓜群眾能感受到順利地“買買買”,背後還有什麼黑科技?跟雷鋒網一起了解一下。

“看到”假貨

為了便於理解,我們還是從特別實操的“如何讓你不買到假貨”說起。

阿里的技術人員是怎麼看哪些是“侵犯了知識產權”的商品呢?

對比圖片,對比款式,對比商標。

但是,不是所有商家上傳圖片時,都是“正正經經‘立正’商標拍照”,有些人只露出商標的一部分,有些是擺出不同的角度,還有一些人故意遮擋。對付文字就更“精明瞭”,他們可能使用變形的文字,並充分利用漢字博大精深的特點。

後來,可以上視頻代替圖片後,有些商家就更厲害了——在很多幀圖片裡上傳一張“隱晦”圖片。

陸全在聊天之前先給我放了一段視頻:仿冒商家在一件正品連衣裙上做了很簡單的樣式改動,比如加了一個蝴蝶結,都能被認出來。

這就要依賴上述打假樣本庫和相關算法。

有意思的是,陸全告訴雷鋒網,現在已經不是採取“敵動我跟”的單點對抗策略,比如,不僅是出現了假貨,收集假貨特徵,被動跟隨打擊,他們會主動尋找假貨特徵,甚至整個黑產的情況,綜合多方面信息“摸底打擊”。甚至在違規商戶只是打算上架“假貨”時,都能精準“擊斃”。

在這樣的背景下,依靠 AI 在商品發佈環節,96%的造假都能被攔截,在修改的過程中不斷檢測和控制,最後能達到每一萬筆中,只有1.1筆被消費者懷疑為假貨。

這種圖片審核和視頻審核背後所採用的 AI 是阿里提出來的“安全AI”大腦的感知區,這個感知區域的核心技術是計算機視覺技術及語音識別技術,是整個系統的感官系統,是對象識別的基礎,為形成後續一系列處理動作邁出第一步。

說白了,“感知區”就是一雙“眼睛”。

剛才“抗擊假貨”只是其中一個應用場景。“眼睛”還有用於線上商品識別的商標檢測、物體檢測、光學字符識別技術,用於營銷環節檢測的廣告圖片分析和視頻直播監測技術,以及用於原創作品保護的多媒體檢索和圖像水印技術等。

如果你要開個店,“眼睛”還要對用於開店身份進行人臉識別、聲紋識別、活體檢測等生物識別。

“眼睛”給線下零售提升效率

不僅是線上,另一個與感知的“眼睛”有關的重要場景是:阿里開設的新零售——線下泛安全場景的保護以及提升效率。

之前有個笑話,說現在小偷已經無錢可偷——因為大家都用電子支付工具,帶個 500 塊現金出門都筭“身懷鉅款”。現在,小偷不僅無錢可偷,可能連實體商品都難以“作案”了。

傳統門店抓小偷的鏈路是這樣的:從錄像看這些貨哪些被人拿走,發現之後,還要看這個人還拿了其他哪些貨。確定之後,要找到這個人正面照片,把照片打印出來再分發給保安。整個回溯錄像和偷竊人的照片的過程,可能需要12-24小時。

如果說“安全AI” 完全替代保安、店員確實是危言聳聽,但它能顯著提升效率。原來線下商店每天需要花 2 小時盤貨,現在可以實時盤貨,原來對丟貨要進行12-24小時的盤貨,現在AI盤貨只需要2個小時。

到底是怎麼做的?

“線下店面現在毛利率很低,你肯定不能通過改造硬件成本提高他們的成本。”雖然陸全看上去是高大上的算法專家,但是考慮用戶需求很實際,那就只有一個辦法,從 AI 算法上改進。

“這些線下店如果採用的是無人店的技術,就會裝貨架攝像頭,對同一個物品有多維去展現,很容易知道這個物品的定位在哪裡,但是一般的監控攝像頭很難知道一個平面的多維度,有可能商品的位置在這兒,實際有很大的偏差,從攝像頭角度,商品的位置已經被挪動,這就要解決二維到三維的問題,我們解決的方式是要對其中很多點事先做多維定位,這樣消耗的是算力資源,比硬件成本要低很多。”

這樣下來,“安全AI” 就知道到底哪些人真的在偷盜,從而實現預警和跟蹤。

一個有意思的數據是,傳統打印慣偷照片分發給保安的情況下,抓住慣偷的概率只有5%,讓 AI上了以後,這個概率能提升到 35%,但是一段時間後,概率大幅下降,原因是,小偷不敢來了。

它不會讓你找出白百合、楊臣剛和C杯

“看見”只是第一步,作為一個有“腦子”的阿里商業風控還需要“認知”。“安全 AI 認知層”的核心技術是自然語言處理技術。

再回到線上場景,如果要對抗購物節和我搶熱銷商品的那麼多機器人,“安全 AI”可以做點什麼?

第一個案例就是“問答式驗證碼”,這是平常我們進行賬戶驗證時時不時會遇到的“關卡”。

以前,我們吐槽過這些逆天的“驗證碼”:

請找出圖中的白百何

跟黑灰產大戰五百回合,阿里進化出“安全AI”大腦

請分辨出這裡的楊臣剛、王大治和孫楠

"

人在江湖飄,哪有不挨刀。

作為一名有11年經驗的資深剁手黨,手起刀落,咱們也是參與了N多億萬項目的社會人(雙11、618、520。。。)。雖然,現在雷鋒網編輯小李已經練成火眼金睛,但是也經歷過那麼幾個“沮喪”時刻。

2008年,我打開了第一張新世界的大門:在淘寶上買了一雙傳說是耐克dunk sb新款的鞋,收到之後,得瑟了半天,眼尖的室友尖叫一聲:不對,你的對勾好像反了。。。。奉行“貧窮我就暫時性失明”的宗旨,我還是開開心心地穿了一個星期,然後在體育課上華麗麗地跑掉了鞋底。。。。

自此,那雙辣眼睛的對勾“耐克”就成了剁手党進階路上無時無刻提醒我的“路標”:注意假貨,還有。。。多賺錢。

跟黑灰產大戰五百回合,阿里進化出“安全AI”大腦

2012 年雙 11 開啟,開心的我認認真真地在購物車囤了一個星期的貨,只待零點,結果零點的鐘聲響起,我還沒反應過來,提交訂單時就遭遇了崩潰——怎麼一下就被搶光了?跟我眼光一致的人這麼多?

那時,命運給我上了一堂我自己還沒搞明白的課:原來還有種東東叫做“秒殺神器”。再到以後,我苦練搶購絕技,卻發現雖然和我一樣的剁手黨越來越多,但踩的坑越來越少。

直到有一天,阿里安全一個做人工智能研究的專家告訴我,他們有個系統,這個系統裡的圖片數據總量相當於 186 箇中國國家圖書館藏量,累積的打假圖片樣本量超過 137 億張。以前他們阿里小二人肉對比打假,吭哧吭哧地幹活,卻怎麼也追不上淘寶發展的速度,現在他們讓 AI 小二上陣,人工查看1張圖片的信息需要 10 秒,5 萬人同時工作的效率才能勉強趕上“知產保護科技大腦(AI 小二)”掃描甄別圖片的速度。

除了打假,他們還靠 AI 打擊黃賭毒,在搶購節點圍追堵截幹壞事的機器人,並抗擊圖謀不軌,準備趁機搞破壞的攻擊者。

跟黑灰產大戰五百回合,阿里進化出“安全AI”大腦

曾經,無數安全從業者告訴我——“感受不到的安全就是真的安全”“什麼都沒發生就是好事”,我總無法感同身受,但是說到“買買買”,我突然就理解了。

8 月 28 日,阿里巴巴集團安全首席算法專家陸全霹靂吧啦說了一堆,大意是上面 AI 能幫我們順利“買買買”的東西其實就是阿里巴巴商業操作系統的風控大腦,也叫做“安全AI”。

我突然又不懂了,“安全AI”除了讓我們這種吃瓜群眾能感受到順利地“買買買”,背後還有什麼黑科技?跟雷鋒網一起了解一下。

“看到”假貨

為了便於理解,我們還是從特別實操的“如何讓你不買到假貨”說起。

阿里的技術人員是怎麼看哪些是“侵犯了知識產權”的商品呢?

對比圖片,對比款式,對比商標。

但是,不是所有商家上傳圖片時,都是“正正經經‘立正’商標拍照”,有些人只露出商標的一部分,有些是擺出不同的角度,還有一些人故意遮擋。對付文字就更“精明瞭”,他們可能使用變形的文字,並充分利用漢字博大精深的特點。

後來,可以上視頻代替圖片後,有些商家就更厲害了——在很多幀圖片裡上傳一張“隱晦”圖片。

陸全在聊天之前先給我放了一段視頻:仿冒商家在一件正品連衣裙上做了很簡單的樣式改動,比如加了一個蝴蝶結,都能被認出來。

這就要依賴上述打假樣本庫和相關算法。

有意思的是,陸全告訴雷鋒網,現在已經不是採取“敵動我跟”的單點對抗策略,比如,不僅是出現了假貨,收集假貨特徵,被動跟隨打擊,他們會主動尋找假貨特徵,甚至整個黑產的情況,綜合多方面信息“摸底打擊”。甚至在違規商戶只是打算上架“假貨”時,都能精準“擊斃”。

在這樣的背景下,依靠 AI 在商品發佈環節,96%的造假都能被攔截,在修改的過程中不斷檢測和控制,最後能達到每一萬筆中,只有1.1筆被消費者懷疑為假貨。

這種圖片審核和視頻審核背後所採用的 AI 是阿里提出來的“安全AI”大腦的感知區,這個感知區域的核心技術是計算機視覺技術及語音識別技術,是整個系統的感官系統,是對象識別的基礎,為形成後續一系列處理動作邁出第一步。

說白了,“感知區”就是一雙“眼睛”。

剛才“抗擊假貨”只是其中一個應用場景。“眼睛”還有用於線上商品識別的商標檢測、物體檢測、光學字符識別技術,用於營銷環節檢測的廣告圖片分析和視頻直播監測技術,以及用於原創作品保護的多媒體檢索和圖像水印技術等。

如果你要開個店,“眼睛”還要對用於開店身份進行人臉識別、聲紋識別、活體檢測等生物識別。

“眼睛”給線下零售提升效率

不僅是線上,另一個與感知的“眼睛”有關的重要場景是:阿里開設的新零售——線下泛安全場景的保護以及提升效率。

之前有個笑話,說現在小偷已經無錢可偷——因為大家都用電子支付工具,帶個 500 塊現金出門都筭“身懷鉅款”。現在,小偷不僅無錢可偷,可能連實體商品都難以“作案”了。

傳統門店抓小偷的鏈路是這樣的:從錄像看這些貨哪些被人拿走,發現之後,還要看這個人還拿了其他哪些貨。確定之後,要找到這個人正面照片,把照片打印出來再分發給保安。整個回溯錄像和偷竊人的照片的過程,可能需要12-24小時。

如果說“安全AI” 完全替代保安、店員確實是危言聳聽,但它能顯著提升效率。原來線下商店每天需要花 2 小時盤貨,現在可以實時盤貨,原來對丟貨要進行12-24小時的盤貨,現在AI盤貨只需要2個小時。

到底是怎麼做的?

“線下店面現在毛利率很低,你肯定不能通過改造硬件成本提高他們的成本。”雖然陸全看上去是高大上的算法專家,但是考慮用戶需求很實際,那就只有一個辦法,從 AI 算法上改進。

“這些線下店如果採用的是無人店的技術,就會裝貨架攝像頭,對同一個物品有多維去展現,很容易知道這個物品的定位在哪裡,但是一般的監控攝像頭很難知道一個平面的多維度,有可能商品的位置在這兒,實際有很大的偏差,從攝像頭角度,商品的位置已經被挪動,這就要解決二維到三維的問題,我們解決的方式是要對其中很多點事先做多維定位,這樣消耗的是算力資源,比硬件成本要低很多。”

這樣下來,“安全AI” 就知道到底哪些人真的在偷盜,從而實現預警和跟蹤。

一個有意思的數據是,傳統打印慣偷照片分發給保安的情況下,抓住慣偷的概率只有5%,讓 AI上了以後,這個概率能提升到 35%,但是一段時間後,概率大幅下降,原因是,小偷不敢來了。

它不會讓你找出白百合、楊臣剛和C杯

“看見”只是第一步,作為一個有“腦子”的阿里商業風控還需要“認知”。“安全 AI 認知層”的核心技術是自然語言處理技術。

再回到線上場景,如果要對抗購物節和我搶熱銷商品的那麼多機器人,“安全 AI”可以做點什麼?

第一個案例就是“問答式驗證碼”,這是平常我們進行賬戶驗證時時不時會遇到的“關卡”。

以前,我們吐槽過這些逆天的“驗證碼”:

請找出圖中的白百何

跟黑灰產大戰五百回合,阿里進化出“安全AI”大腦

請分辨出這裡的楊臣剛、王大治和孫楠

跟黑灰產大戰五百回合,阿里進化出“安全AI”大腦

這些我們都忍了,直到有一天,有人拿出了一張驗證碼的圖片:XXXXXXX,請找出這裡的C杯。

"

人在江湖飄,哪有不挨刀。

作為一名有11年經驗的資深剁手黨,手起刀落,咱們也是參與了N多億萬項目的社會人(雙11、618、520。。。)。雖然,現在雷鋒網編輯小李已經練成火眼金睛,但是也經歷過那麼幾個“沮喪”時刻。

2008年,我打開了第一張新世界的大門:在淘寶上買了一雙傳說是耐克dunk sb新款的鞋,收到之後,得瑟了半天,眼尖的室友尖叫一聲:不對,你的對勾好像反了。。。。奉行“貧窮我就暫時性失明”的宗旨,我還是開開心心地穿了一個星期,然後在體育課上華麗麗地跑掉了鞋底。。。。

自此,那雙辣眼睛的對勾“耐克”就成了剁手党進階路上無時無刻提醒我的“路標”:注意假貨,還有。。。多賺錢。

跟黑灰產大戰五百回合,阿里進化出“安全AI”大腦

2012 年雙 11 開啟,開心的我認認真真地在購物車囤了一個星期的貨,只待零點,結果零點的鐘聲響起,我還沒反應過來,提交訂單時就遭遇了崩潰——怎麼一下就被搶光了?跟我眼光一致的人這麼多?

那時,命運給我上了一堂我自己還沒搞明白的課:原來還有種東東叫做“秒殺神器”。再到以後,我苦練搶購絕技,卻發現雖然和我一樣的剁手黨越來越多,但踩的坑越來越少。

直到有一天,阿里安全一個做人工智能研究的專家告訴我,他們有個系統,這個系統裡的圖片數據總量相當於 186 箇中國國家圖書館藏量,累積的打假圖片樣本量超過 137 億張。以前他們阿里小二人肉對比打假,吭哧吭哧地幹活,卻怎麼也追不上淘寶發展的速度,現在他們讓 AI 小二上陣,人工查看1張圖片的信息需要 10 秒,5 萬人同時工作的效率才能勉強趕上“知產保護科技大腦(AI 小二)”掃描甄別圖片的速度。

除了打假,他們還靠 AI 打擊黃賭毒,在搶購節點圍追堵截幹壞事的機器人,並抗擊圖謀不軌,準備趁機搞破壞的攻擊者。

跟黑灰產大戰五百回合,阿里進化出“安全AI”大腦

曾經,無數安全從業者告訴我——“感受不到的安全就是真的安全”“什麼都沒發生就是好事”,我總無法感同身受,但是說到“買買買”,我突然就理解了。

8 月 28 日,阿里巴巴集團安全首席算法專家陸全霹靂吧啦說了一堆,大意是上面 AI 能幫我們順利“買買買”的東西其實就是阿里巴巴商業操作系統的風控大腦,也叫做“安全AI”。

我突然又不懂了,“安全AI”除了讓我們這種吃瓜群眾能感受到順利地“買買買”,背後還有什麼黑科技?跟雷鋒網一起了解一下。

“看到”假貨

為了便於理解,我們還是從特別實操的“如何讓你不買到假貨”說起。

阿里的技術人員是怎麼看哪些是“侵犯了知識產權”的商品呢?

對比圖片,對比款式,對比商標。

但是,不是所有商家上傳圖片時,都是“正正經經‘立正’商標拍照”,有些人只露出商標的一部分,有些是擺出不同的角度,還有一些人故意遮擋。對付文字就更“精明瞭”,他們可能使用變形的文字,並充分利用漢字博大精深的特點。

後來,可以上視頻代替圖片後,有些商家就更厲害了——在很多幀圖片裡上傳一張“隱晦”圖片。

陸全在聊天之前先給我放了一段視頻:仿冒商家在一件正品連衣裙上做了很簡單的樣式改動,比如加了一個蝴蝶結,都能被認出來。

這就要依賴上述打假樣本庫和相關算法。

有意思的是,陸全告訴雷鋒網,現在已經不是採取“敵動我跟”的單點對抗策略,比如,不僅是出現了假貨,收集假貨特徵,被動跟隨打擊,他們會主動尋找假貨特徵,甚至整個黑產的情況,綜合多方面信息“摸底打擊”。甚至在違規商戶只是打算上架“假貨”時,都能精準“擊斃”。

在這樣的背景下,依靠 AI 在商品發佈環節,96%的造假都能被攔截,在修改的過程中不斷檢測和控制,最後能達到每一萬筆中,只有1.1筆被消費者懷疑為假貨。

這種圖片審核和視頻審核背後所採用的 AI 是阿里提出來的“安全AI”大腦的感知區,這個感知區域的核心技術是計算機視覺技術及語音識別技術,是整個系統的感官系統,是對象識別的基礎,為形成後續一系列處理動作邁出第一步。

說白了,“感知區”就是一雙“眼睛”。

剛才“抗擊假貨”只是其中一個應用場景。“眼睛”還有用於線上商品識別的商標檢測、物體檢測、光學字符識別技術,用於營銷環節檢測的廣告圖片分析和視頻直播監測技術,以及用於原創作品保護的多媒體檢索和圖像水印技術等。

如果你要開個店,“眼睛”還要對用於開店身份進行人臉識別、聲紋識別、活體檢測等生物識別。

“眼睛”給線下零售提升效率

不僅是線上,另一個與感知的“眼睛”有關的重要場景是:阿里開設的新零售——線下泛安全場景的保護以及提升效率。

之前有個笑話,說現在小偷已經無錢可偷——因為大家都用電子支付工具,帶個 500 塊現金出門都筭“身懷鉅款”。現在,小偷不僅無錢可偷,可能連實體商品都難以“作案”了。

傳統門店抓小偷的鏈路是這樣的:從錄像看這些貨哪些被人拿走,發現之後,還要看這個人還拿了其他哪些貨。確定之後,要找到這個人正面照片,把照片打印出來再分發給保安。整個回溯錄像和偷竊人的照片的過程,可能需要12-24小時。

如果說“安全AI” 完全替代保安、店員確實是危言聳聽,但它能顯著提升效率。原來線下商店每天需要花 2 小時盤貨,現在可以實時盤貨,原來對丟貨要進行12-24小時的盤貨,現在AI盤貨只需要2個小時。

到底是怎麼做的?

“線下店面現在毛利率很低,你肯定不能通過改造硬件成本提高他們的成本。”雖然陸全看上去是高大上的算法專家,但是考慮用戶需求很實際,那就只有一個辦法,從 AI 算法上改進。

“這些線下店如果採用的是無人店的技術,就會裝貨架攝像頭,對同一個物品有多維去展現,很容易知道這個物品的定位在哪裡,但是一般的監控攝像頭很難知道一個平面的多維度,有可能商品的位置在這兒,實際有很大的偏差,從攝像頭角度,商品的位置已經被挪動,這就要解決二維到三維的問題,我們解決的方式是要對其中很多點事先做多維定位,這樣消耗的是算力資源,比硬件成本要低很多。”

這樣下來,“安全AI” 就知道到底哪些人真的在偷盜,從而實現預警和跟蹤。

一個有意思的數據是,傳統打印慣偷照片分發給保安的情況下,抓住慣偷的概率只有5%,讓 AI上了以後,這個概率能提升到 35%,但是一段時間後,概率大幅下降,原因是,小偷不敢來了。

它不會讓你找出白百合、楊臣剛和C杯

“看見”只是第一步,作為一個有“腦子”的阿里商業風控還需要“認知”。“安全 AI 認知層”的核心技術是自然語言處理技術。

再回到線上場景,如果要對抗購物節和我搶熱銷商品的那麼多機器人,“安全 AI”可以做點什麼?

第一個案例就是“問答式驗證碼”,這是平常我們進行賬戶驗證時時不時會遇到的“關卡”。

以前,我們吐槽過這些逆天的“驗證碼”:

請找出圖中的白百何

跟黑灰產大戰五百回合,阿里進化出“安全AI”大腦

請分辨出這裡的楊臣剛、王大治和孫楠

跟黑灰產大戰五百回合,阿里進化出“安全AI”大腦

這些我們都忍了,直到有一天,有人拿出了一張驗證碼的圖片:XXXXXXX,請找出這裡的C杯。

跟黑灰產大戰五百回合,阿里進化出“安全AI”大腦

“安全AI”比較人性化,好像沒有問這麼令人腎上腺素飆升的問題,因為它問的問題可能是從大家在淘寶中的評論裡提取的。

比如:

“顏色比圖片上暗,是比較氣質的款式,快遞真的超級快。”

AI 會從其中提取情感屬性和商品屬性,然後呈現出一個驗證問答:

"

人在江湖飄,哪有不挨刀。

作為一名有11年經驗的資深剁手黨,手起刀落,咱們也是參與了N多億萬項目的社會人(雙11、618、520。。。)。雖然,現在雷鋒網編輯小李已經練成火眼金睛,但是也經歷過那麼幾個“沮喪”時刻。

2008年,我打開了第一張新世界的大門:在淘寶上買了一雙傳說是耐克dunk sb新款的鞋,收到之後,得瑟了半天,眼尖的室友尖叫一聲:不對,你的對勾好像反了。。。。奉行“貧窮我就暫時性失明”的宗旨,我還是開開心心地穿了一個星期,然後在體育課上華麗麗地跑掉了鞋底。。。。

自此,那雙辣眼睛的對勾“耐克”就成了剁手党進階路上無時無刻提醒我的“路標”:注意假貨,還有。。。多賺錢。

跟黑灰產大戰五百回合,阿里進化出“安全AI”大腦

2012 年雙 11 開啟,開心的我認認真真地在購物車囤了一個星期的貨,只待零點,結果零點的鐘聲響起,我還沒反應過來,提交訂單時就遭遇了崩潰——怎麼一下就被搶光了?跟我眼光一致的人這麼多?

那時,命運給我上了一堂我自己還沒搞明白的課:原來還有種東東叫做“秒殺神器”。再到以後,我苦練搶購絕技,卻發現雖然和我一樣的剁手黨越來越多,但踩的坑越來越少。

直到有一天,阿里安全一個做人工智能研究的專家告訴我,他們有個系統,這個系統裡的圖片數據總量相當於 186 箇中國國家圖書館藏量,累積的打假圖片樣本量超過 137 億張。以前他們阿里小二人肉對比打假,吭哧吭哧地幹活,卻怎麼也追不上淘寶發展的速度,現在他們讓 AI 小二上陣,人工查看1張圖片的信息需要 10 秒,5 萬人同時工作的效率才能勉強趕上“知產保護科技大腦(AI 小二)”掃描甄別圖片的速度。

除了打假,他們還靠 AI 打擊黃賭毒,在搶購節點圍追堵截幹壞事的機器人,並抗擊圖謀不軌,準備趁機搞破壞的攻擊者。

跟黑灰產大戰五百回合,阿里進化出“安全AI”大腦

曾經,無數安全從業者告訴我——“感受不到的安全就是真的安全”“什麼都沒發生就是好事”,我總無法感同身受,但是說到“買買買”,我突然就理解了。

8 月 28 日,阿里巴巴集團安全首席算法專家陸全霹靂吧啦說了一堆,大意是上面 AI 能幫我們順利“買買買”的東西其實就是阿里巴巴商業操作系統的風控大腦,也叫做“安全AI”。

我突然又不懂了,“安全AI”除了讓我們這種吃瓜群眾能感受到順利地“買買買”,背後還有什麼黑科技?跟雷鋒網一起了解一下。

“看到”假貨

為了便於理解,我們還是從特別實操的“如何讓你不買到假貨”說起。

阿里的技術人員是怎麼看哪些是“侵犯了知識產權”的商品呢?

對比圖片,對比款式,對比商標。

但是,不是所有商家上傳圖片時,都是“正正經經‘立正’商標拍照”,有些人只露出商標的一部分,有些是擺出不同的角度,還有一些人故意遮擋。對付文字就更“精明瞭”,他們可能使用變形的文字,並充分利用漢字博大精深的特點。

後來,可以上視頻代替圖片後,有些商家就更厲害了——在很多幀圖片裡上傳一張“隱晦”圖片。

陸全在聊天之前先給我放了一段視頻:仿冒商家在一件正品連衣裙上做了很簡單的樣式改動,比如加了一個蝴蝶結,都能被認出來。

這就要依賴上述打假樣本庫和相關算法。

有意思的是,陸全告訴雷鋒網,現在已經不是採取“敵動我跟”的單點對抗策略,比如,不僅是出現了假貨,收集假貨特徵,被動跟隨打擊,他們會主動尋找假貨特徵,甚至整個黑產的情況,綜合多方面信息“摸底打擊”。甚至在違規商戶只是打算上架“假貨”時,都能精準“擊斃”。

在這樣的背景下,依靠 AI 在商品發佈環節,96%的造假都能被攔截,在修改的過程中不斷檢測和控制,最後能達到每一萬筆中,只有1.1筆被消費者懷疑為假貨。

這種圖片審核和視頻審核背後所採用的 AI 是阿里提出來的“安全AI”大腦的感知區,這個感知區域的核心技術是計算機視覺技術及語音識別技術,是整個系統的感官系統,是對象識別的基礎,為形成後續一系列處理動作邁出第一步。

說白了,“感知區”就是一雙“眼睛”。

剛才“抗擊假貨”只是其中一個應用場景。“眼睛”還有用於線上商品識別的商標檢測、物體檢測、光學字符識別技術,用於營銷環節檢測的廣告圖片分析和視頻直播監測技術,以及用於原創作品保護的多媒體檢索和圖像水印技術等。

如果你要開個店,“眼睛”還要對用於開店身份進行人臉識別、聲紋識別、活體檢測等生物識別。

“眼睛”給線下零售提升效率

不僅是線上,另一個與感知的“眼睛”有關的重要場景是:阿里開設的新零售——線下泛安全場景的保護以及提升效率。

之前有個笑話,說現在小偷已經無錢可偷——因為大家都用電子支付工具,帶個 500 塊現金出門都筭“身懷鉅款”。現在,小偷不僅無錢可偷,可能連實體商品都難以“作案”了。

傳統門店抓小偷的鏈路是這樣的:從錄像看這些貨哪些被人拿走,發現之後,還要看這個人還拿了其他哪些貨。確定之後,要找到這個人正面照片,把照片打印出來再分發給保安。整個回溯錄像和偷竊人的照片的過程,可能需要12-24小時。

如果說“安全AI” 完全替代保安、店員確實是危言聳聽,但它能顯著提升效率。原來線下商店每天需要花 2 小時盤貨,現在可以實時盤貨,原來對丟貨要進行12-24小時的盤貨,現在AI盤貨只需要2個小時。

到底是怎麼做的?

“線下店面現在毛利率很低,你肯定不能通過改造硬件成本提高他們的成本。”雖然陸全看上去是高大上的算法專家,但是考慮用戶需求很實際,那就只有一個辦法,從 AI 算法上改進。

“這些線下店如果採用的是無人店的技術,就會裝貨架攝像頭,對同一個物品有多維去展現,很容易知道這個物品的定位在哪裡,但是一般的監控攝像頭很難知道一個平面的多維度,有可能商品的位置在這兒,實際有很大的偏差,從攝像頭角度,商品的位置已經被挪動,這就要解決二維到三維的問題,我們解決的方式是要對其中很多點事先做多維定位,這樣消耗的是算力資源,比硬件成本要低很多。”

這樣下來,“安全AI” 就知道到底哪些人真的在偷盜,從而實現預警和跟蹤。

一個有意思的數據是,傳統打印慣偷照片分發給保安的情況下,抓住慣偷的概率只有5%,讓 AI上了以後,這個概率能提升到 35%,但是一段時間後,概率大幅下降,原因是,小偷不敢來了。

它不會讓你找出白百合、楊臣剛和C杯

“看見”只是第一步,作為一個有“腦子”的阿里商業風控還需要“認知”。“安全 AI 認知層”的核心技術是自然語言處理技術。

再回到線上場景,如果要對抗購物節和我搶熱銷商品的那麼多機器人,“安全 AI”可以做點什麼?

第一個案例就是“問答式驗證碼”,這是平常我們進行賬戶驗證時時不時會遇到的“關卡”。

以前,我們吐槽過這些逆天的“驗證碼”:

請找出圖中的白百何

跟黑灰產大戰五百回合,阿里進化出“安全AI”大腦

請分辨出這裡的楊臣剛、王大治和孫楠

跟黑灰產大戰五百回合,阿里進化出“安全AI”大腦

這些我們都忍了,直到有一天,有人拿出了一張驗證碼的圖片:XXXXXXX,請找出這裡的C杯。

跟黑灰產大戰五百回合,阿里進化出“安全AI”大腦

“安全AI”比較人性化,好像沒有問這麼令人腎上腺素飆升的問題,因為它問的問題可能是從大家在淘寶中的評論裡提取的。

比如:

“顏色比圖片上暗,是比較氣質的款式,快遞真的超級快。”

AI 會從其中提取情感屬性和商品屬性,然後呈現出一個驗證問答:

跟黑灰產大戰五百回合,阿里進化出“安全AI”大腦

陸全告訴雷鋒網,這種驗證模式利用阿里電商平臺海量信息做文本生成,其實包含了三重防護體系:

1)認知問答:給出一段文本,基於對文本的理解和推理回答問題,考察語言認知能力。

2)圖像對抗:文本問題以圖片的形式展現,通過注入對抗樣本,影響主流OCR識別算法的檢測效果;

3)行為檢測:回答問題需要通過拖拽的方式完成,基於行為的大數據分析以及端上的安全防控,進行人機區分;

通過這三個方式,對於某些風險較高的賬戶進行認證,可以以95%的概率識別出“非我族類”。

這樣做主要還是為了提供攻擊方的門檻。因為淘寶等電商平臺可以日均產生千萬級的高質量評論,題庫規模足夠大,想通過扒題庫的方式破擊驗證系統幾乎不可能,另外基於自有數據也導致一般的算法模型很難適用。

AI 通過對商品評論做屬性級的情感分析,提煉出問答知識點,例如對商品某一屬性的評價是什麼,評價是正面還是負面的,這樣j基於提煉的結構化知識點,生成自然語言的問答,增加了問題的多樣性。

一句話,機器要想看懂並明白它,很難。

AI 當臥底,海底撈針

另一個能提升“安全 AI ”認知能力的是“風險分析”,也就是說,靠 AI 算法從海量信息中找到這些問題的答案:

1. 誰在對我虎視眈眈?他們從哪裡來,到哪裡去,要幹什麼?堪比回答人生的終極疑問。

2. 以前那些看上去“沒有什麼背景”的攻擊到底是誰幹的?張三家大白鵝丟了和五百公里外的李四家有什麼潛在關係?XX團伙發起的攻擊與一年前發起的那一波攻擊有沒有關聯?

3. 現在主流威脅有哪些?我未來還會受到哪些黑灰產攻擊?

“安全AI”背後的阿里安全團隊自己上還不夠,以防萬一,要請來大牛坐鎮——安全AI的“風險分析”與達摩院有諸多合作,達摩院在自然語言處理技術上很強,在機器翻譯、多人對話方面都取得了挺多公開數據級測試世界第一。

“我們跟它進行深度合作,做NLP的處理”。陸全說。

靠著自己爭氣和“背後有人”,60%的黑灰產風險被機器自動化發現並首次最先報警,“安全AI”發掘了黑灰產關係於線上風控,並開啟“大喇叭”推廣到全域經濟體。

當然,判斷“用戶”是機器人還是真實人類,發掘黑灰產情況還不夠,一個優秀的大腦還要跟蹤風險賬戶的行為,由己及彼,具有超強的推理能力。

“安全AI”決策層的核心技術包括深度學習和強化學習兩塊,用來解決現實中的複雜決策問題。它決定了系統該如何動作,如何更合理有效地作出最佳應對。例如,當面臨商家實時博弈、信息內容的變異,以及黑產的惡意攻擊時,在全局視角下做出更有利的決策。

比如,如果它發現了一個可疑份子,一次可疑行為,要像一個深謀遠慮的軍師一樣善於佈局,“拔出蘿蔔帶出泥”,清楚地構建一個整體線索圖,更具全局觀。

“帳號跟帳號之間是有關聯的,它的關聯可能通過共同買同樣的商品,或者共同評價同樣的商品,或者互相評價這些關聯,我們做風控就是用全局的信息才能夠挖掘到後面的團伙信息。”陸全說。

如果今天有一群穿著黑衣服的人來“打家劫舍”,明天就算這群人穿了綠衣服,戴了口罩,AI 也能“認出”他們。

“安全AI” 也要自衛

可能出乎你意料的是,“安全AI”大腦不僅要有發現威脅的各種感知、認知、決策能力,還要有自衛的能力——保護層,保護自己和系統不受到傷害。

這裡要提到三項有意思的技術:源碼保護、自動化漏洞挖掘及對抗樣本訓練。

為了保證自己辛辛苦苦做出的各類 AI 引擎不被壞人輕易複製、利用和對抗,阿里的安全研究人員還要“抱”住自己的 AI 模型。

但是,現在有越來越多的機器學習的模型代碼都會布到端上,或者是布到不可控的地方。為了保護自己的源碼,他們只好選擇把編譯好的編譯碼放到端上,而不是把源碼放上面,這樣人即使可以讀懂源碼,但讀不懂編譯碼,陸全等人把“安全AI”的核心模型都變成了一個只有阿里的知識引擎才能看懂的機器。

此刻,我想起了明星閨蜜才知道的一個暗號。

A:今天我去做頭髮。

B:懂,如果你老公問我的話。

陸全還提到,安全 AI 在很多應用上面歸根結底變成了代碼,有代碼就會有漏洞。

“可怕的是,我們現在發現有一個問題在 AI 界是比較嚴重的。大家模型和框架都有非常強的同質性,你用的、我用的、他用的都差不多,就好像大家基本上基因構造都很類似。以後萬一有一種病毒或者有一種攻擊方式出來,基本上所有的人都沒有免疫力,都很容易中招。”

所以,“安全AI”要對自身和阿里本身的業務系統進行自動化的漏洞挖掘,未雨綢繆,找到更多缺陷,及早預防。

上述都是從外部治理 AI 系統,但是提升 AI 模型本身對付惡意攻擊的適應能力,還要靠對抗訓練樣本的方式。

事先產生一些比較接近於黑客或者黑灰產容易攻擊的樣本,把樣本加到訓練集裡面,讓模型在訓練產生的時候,就已經具備抵抗一些變異和攻擊的能力。”

不知為何,陸全的闡釋讓我想到了大神周伯通的雙手互搏。

最強高手的目標,永遠在於如何戰勝自己。

"

人在江湖飄,哪有不挨刀。

作為一名有11年經驗的資深剁手黨,手起刀落,咱們也是參與了N多億萬項目的社會人(雙11、618、520。。。)。雖然,現在雷鋒網編輯小李已經練成火眼金睛,但是也經歷過那麼幾個“沮喪”時刻。

2008年,我打開了第一張新世界的大門:在淘寶上買了一雙傳說是耐克dunk sb新款的鞋,收到之後,得瑟了半天,眼尖的室友尖叫一聲:不對,你的對勾好像反了。。。。奉行“貧窮我就暫時性失明”的宗旨,我還是開開心心地穿了一個星期,然後在體育課上華麗麗地跑掉了鞋底。。。。

自此,那雙辣眼睛的對勾“耐克”就成了剁手党進階路上無時無刻提醒我的“路標”:注意假貨,還有。。。多賺錢。

跟黑灰產大戰五百回合,阿里進化出“安全AI”大腦

2012 年雙 11 開啟,開心的我認認真真地在購物車囤了一個星期的貨,只待零點,結果零點的鐘聲響起,我還沒反應過來,提交訂單時就遭遇了崩潰——怎麼一下就被搶光了?跟我眼光一致的人這麼多?

那時,命運給我上了一堂我自己還沒搞明白的課:原來還有種東東叫做“秒殺神器”。再到以後,我苦練搶購絕技,卻發現雖然和我一樣的剁手黨越來越多,但踩的坑越來越少。

直到有一天,阿里安全一個做人工智能研究的專家告訴我,他們有個系統,這個系統裡的圖片數據總量相當於 186 箇中國國家圖書館藏量,累積的打假圖片樣本量超過 137 億張。以前他們阿里小二人肉對比打假,吭哧吭哧地幹活,卻怎麼也追不上淘寶發展的速度,現在他們讓 AI 小二上陣,人工查看1張圖片的信息需要 10 秒,5 萬人同時工作的效率才能勉強趕上“知產保護科技大腦(AI 小二)”掃描甄別圖片的速度。

除了打假,他們還靠 AI 打擊黃賭毒,在搶購節點圍追堵截幹壞事的機器人,並抗擊圖謀不軌,準備趁機搞破壞的攻擊者。

跟黑灰產大戰五百回合,阿里進化出“安全AI”大腦

曾經,無數安全從業者告訴我——“感受不到的安全就是真的安全”“什麼都沒發生就是好事”,我總無法感同身受,但是說到“買買買”,我突然就理解了。

8 月 28 日,阿里巴巴集團安全首席算法專家陸全霹靂吧啦說了一堆,大意是上面 AI 能幫我們順利“買買買”的東西其實就是阿里巴巴商業操作系統的風控大腦,也叫做“安全AI”。

我突然又不懂了,“安全AI”除了讓我們這種吃瓜群眾能感受到順利地“買買買”,背後還有什麼黑科技?跟雷鋒網一起了解一下。

“看到”假貨

為了便於理解,我們還是從特別實操的“如何讓你不買到假貨”說起。

阿里的技術人員是怎麼看哪些是“侵犯了知識產權”的商品呢?

對比圖片,對比款式,對比商標。

但是,不是所有商家上傳圖片時,都是“正正經經‘立正’商標拍照”,有些人只露出商標的一部分,有些是擺出不同的角度,還有一些人故意遮擋。對付文字就更“精明瞭”,他們可能使用變形的文字,並充分利用漢字博大精深的特點。

後來,可以上視頻代替圖片後,有些商家就更厲害了——在很多幀圖片裡上傳一張“隱晦”圖片。

陸全在聊天之前先給我放了一段視頻:仿冒商家在一件正品連衣裙上做了很簡單的樣式改動,比如加了一個蝴蝶結,都能被認出來。

這就要依賴上述打假樣本庫和相關算法。

有意思的是,陸全告訴雷鋒網,現在已經不是採取“敵動我跟”的單點對抗策略,比如,不僅是出現了假貨,收集假貨特徵,被動跟隨打擊,他們會主動尋找假貨特徵,甚至整個黑產的情況,綜合多方面信息“摸底打擊”。甚至在違規商戶只是打算上架“假貨”時,都能精準“擊斃”。

在這樣的背景下,依靠 AI 在商品發佈環節,96%的造假都能被攔截,在修改的過程中不斷檢測和控制,最後能達到每一萬筆中,只有1.1筆被消費者懷疑為假貨。

這種圖片審核和視頻審核背後所採用的 AI 是阿里提出來的“安全AI”大腦的感知區,這個感知區域的核心技術是計算機視覺技術及語音識別技術,是整個系統的感官系統,是對象識別的基礎,為形成後續一系列處理動作邁出第一步。

說白了,“感知區”就是一雙“眼睛”。

剛才“抗擊假貨”只是其中一個應用場景。“眼睛”還有用於線上商品識別的商標檢測、物體檢測、光學字符識別技術,用於營銷環節檢測的廣告圖片分析和視頻直播監測技術,以及用於原創作品保護的多媒體檢索和圖像水印技術等。

如果你要開個店,“眼睛”還要對用於開店身份進行人臉識別、聲紋識別、活體檢測等生物識別。

“眼睛”給線下零售提升效率

不僅是線上,另一個與感知的“眼睛”有關的重要場景是:阿里開設的新零售——線下泛安全場景的保護以及提升效率。

之前有個笑話,說現在小偷已經無錢可偷——因為大家都用電子支付工具,帶個 500 塊現金出門都筭“身懷鉅款”。現在,小偷不僅無錢可偷,可能連實體商品都難以“作案”了。

傳統門店抓小偷的鏈路是這樣的:從錄像看這些貨哪些被人拿走,發現之後,還要看這個人還拿了其他哪些貨。確定之後,要找到這個人正面照片,把照片打印出來再分發給保安。整個回溯錄像和偷竊人的照片的過程,可能需要12-24小時。

如果說“安全AI” 完全替代保安、店員確實是危言聳聽,但它能顯著提升效率。原來線下商店每天需要花 2 小時盤貨,現在可以實時盤貨,原來對丟貨要進行12-24小時的盤貨,現在AI盤貨只需要2個小時。

到底是怎麼做的?

“線下店面現在毛利率很低,你肯定不能通過改造硬件成本提高他們的成本。”雖然陸全看上去是高大上的算法專家,但是考慮用戶需求很實際,那就只有一個辦法,從 AI 算法上改進。

“這些線下店如果採用的是無人店的技術,就會裝貨架攝像頭,對同一個物品有多維去展現,很容易知道這個物品的定位在哪裡,但是一般的監控攝像頭很難知道一個平面的多維度,有可能商品的位置在這兒,實際有很大的偏差,從攝像頭角度,商品的位置已經被挪動,這就要解決二維到三維的問題,我們解決的方式是要對其中很多點事先做多維定位,這樣消耗的是算力資源,比硬件成本要低很多。”

這樣下來,“安全AI” 就知道到底哪些人真的在偷盜,從而實現預警和跟蹤。

一個有意思的數據是,傳統打印慣偷照片分發給保安的情況下,抓住慣偷的概率只有5%,讓 AI上了以後,這個概率能提升到 35%,但是一段時間後,概率大幅下降,原因是,小偷不敢來了。

它不會讓你找出白百合、楊臣剛和C杯

“看見”只是第一步,作為一個有“腦子”的阿里商業風控還需要“認知”。“安全 AI 認知層”的核心技術是自然語言處理技術。

再回到線上場景,如果要對抗購物節和我搶熱銷商品的那麼多機器人,“安全 AI”可以做點什麼?

第一個案例就是“問答式驗證碼”,這是平常我們進行賬戶驗證時時不時會遇到的“關卡”。

以前,我們吐槽過這些逆天的“驗證碼”:

請找出圖中的白百何

跟黑灰產大戰五百回合,阿里進化出“安全AI”大腦

請分辨出這裡的楊臣剛、王大治和孫楠

跟黑灰產大戰五百回合,阿里進化出“安全AI”大腦

這些我們都忍了,直到有一天,有人拿出了一張驗證碼的圖片:XXXXXXX,請找出這裡的C杯。

跟黑灰產大戰五百回合,阿里進化出“安全AI”大腦

“安全AI”比較人性化,好像沒有問這麼令人腎上腺素飆升的問題,因為它問的問題可能是從大家在淘寶中的評論裡提取的。

比如:

“顏色比圖片上暗,是比較氣質的款式,快遞真的超級快。”

AI 會從其中提取情感屬性和商品屬性,然後呈現出一個驗證問答:

跟黑灰產大戰五百回合,阿里進化出“安全AI”大腦

陸全告訴雷鋒網,這種驗證模式利用阿里電商平臺海量信息做文本生成,其實包含了三重防護體系:

1)認知問答:給出一段文本,基於對文本的理解和推理回答問題,考察語言認知能力。

2)圖像對抗:文本問題以圖片的形式展現,通過注入對抗樣本,影響主流OCR識別算法的檢測效果;

3)行為檢測:回答問題需要通過拖拽的方式完成,基於行為的大數據分析以及端上的安全防控,進行人機區分;

通過這三個方式,對於某些風險較高的賬戶進行認證,可以以95%的概率識別出“非我族類”。

這樣做主要還是為了提供攻擊方的門檻。因為淘寶等電商平臺可以日均產生千萬級的高質量評論,題庫規模足夠大,想通過扒題庫的方式破擊驗證系統幾乎不可能,另外基於自有數據也導致一般的算法模型很難適用。

AI 通過對商品評論做屬性級的情感分析,提煉出問答知識點,例如對商品某一屬性的評價是什麼,評價是正面還是負面的,這樣j基於提煉的結構化知識點,生成自然語言的問答,增加了問題的多樣性。

一句話,機器要想看懂並明白它,很難。

AI 當臥底,海底撈針

另一個能提升“安全 AI ”認知能力的是“風險分析”,也就是說,靠 AI 算法從海量信息中找到這些問題的答案:

1. 誰在對我虎視眈眈?他們從哪裡來,到哪裡去,要幹什麼?堪比回答人生的終極疑問。

2. 以前那些看上去“沒有什麼背景”的攻擊到底是誰幹的?張三家大白鵝丟了和五百公里外的李四家有什麼潛在關係?XX團伙發起的攻擊與一年前發起的那一波攻擊有沒有關聯?

3. 現在主流威脅有哪些?我未來還會受到哪些黑灰產攻擊?

“安全AI”背後的阿里安全團隊自己上還不夠,以防萬一,要請來大牛坐鎮——安全AI的“風險分析”與達摩院有諸多合作,達摩院在自然語言處理技術上很強,在機器翻譯、多人對話方面都取得了挺多公開數據級測試世界第一。

“我們跟它進行深度合作,做NLP的處理”。陸全說。

靠著自己爭氣和“背後有人”,60%的黑灰產風險被機器自動化發現並首次最先報警,“安全AI”發掘了黑灰產關係於線上風控,並開啟“大喇叭”推廣到全域經濟體。

當然,判斷“用戶”是機器人還是真實人類,發掘黑灰產情況還不夠,一個優秀的大腦還要跟蹤風險賬戶的行為,由己及彼,具有超強的推理能力。

“安全AI”決策層的核心技術包括深度學習和強化學習兩塊,用來解決現實中的複雜決策問題。它決定了系統該如何動作,如何更合理有效地作出最佳應對。例如,當面臨商家實時博弈、信息內容的變異,以及黑產的惡意攻擊時,在全局視角下做出更有利的決策。

比如,如果它發現了一個可疑份子,一次可疑行為,要像一個深謀遠慮的軍師一樣善於佈局,“拔出蘿蔔帶出泥”,清楚地構建一個整體線索圖,更具全局觀。

“帳號跟帳號之間是有關聯的,它的關聯可能通過共同買同樣的商品,或者共同評價同樣的商品,或者互相評價這些關聯,我們做風控就是用全局的信息才能夠挖掘到後面的團伙信息。”陸全說。

如果今天有一群穿著黑衣服的人來“打家劫舍”,明天就算這群人穿了綠衣服,戴了口罩,AI 也能“認出”他們。

“安全AI” 也要自衛

可能出乎你意料的是,“安全AI”大腦不僅要有發現威脅的各種感知、認知、決策能力,還要有自衛的能力——保護層,保護自己和系統不受到傷害。

這裡要提到三項有意思的技術:源碼保護、自動化漏洞挖掘及對抗樣本訓練。

為了保證自己辛辛苦苦做出的各類 AI 引擎不被壞人輕易複製、利用和對抗,阿里的安全研究人員還要“抱”住自己的 AI 模型。

但是,現在有越來越多的機器學習的模型代碼都會布到端上,或者是布到不可控的地方。為了保護自己的源碼,他們只好選擇把編譯好的編譯碼放到端上,而不是把源碼放上面,這樣人即使可以讀懂源碼,但讀不懂編譯碼,陸全等人把“安全AI”的核心模型都變成了一個只有阿里的知識引擎才能看懂的機器。

此刻,我想起了明星閨蜜才知道的一個暗號。

A:今天我去做頭髮。

B:懂,如果你老公問我的話。

陸全還提到,安全 AI 在很多應用上面歸根結底變成了代碼,有代碼就會有漏洞。

“可怕的是,我們現在發現有一個問題在 AI 界是比較嚴重的。大家模型和框架都有非常強的同質性,你用的、我用的、他用的都差不多,就好像大家基本上基因構造都很類似。以後萬一有一種病毒或者有一種攻擊方式出來,基本上所有的人都沒有免疫力,都很容易中招。”

所以,“安全AI”要對自身和阿里本身的業務系統進行自動化的漏洞挖掘,未雨綢繆,找到更多缺陷,及早預防。

上述都是從外部治理 AI 系統,但是提升 AI 模型本身對付惡意攻擊的適應能力,還要靠對抗訓練樣本的方式。

事先產生一些比較接近於黑客或者黑灰產容易攻擊的樣本,把樣本加到訓練集裡面,讓模型在訓練產生的時候,就已經具備抵抗一些變異和攻擊的能力。”

不知為何,陸全的闡釋讓我想到了大神周伯通的雙手互搏。

最強高手的目標,永遠在於如何戰勝自己。

跟黑灰產大戰五百回合,阿里進化出“安全AI”大腦

[陸全]

雷鋒網。

"

相關推薦

推薦中...