專訪算法天才蓋坤:阿里媽媽利用AI算法在廣告業務的應用

由中國計算機學會(CCF)主辦,雷鋒網和香港中文大學(深圳)承辦的CCF-GAIR全球人工智能與機器人(300024,診股)峰會終於悉數落幕。

阿里媽媽精準展示廣告技術總監蓋坤

在大會第三天的機器人專場上,阿里媽媽精準展示廣告技術總監蓋坤作為主場演講嘉賓,為大家帶來了《互聯網大數據下的模型結構挑戰》的演講。在演講中,蓋坤對Kernel方法、Tree based方法等經典模型在互聯網大數據下存在的問題進行了介紹,並就其提出的MLR模型和深層用戶興趣網絡做了深入淺出的講解。

阿里媽媽:阿里巴巴的主要變現來源

蓋坤所屬的阿里媽媽,是阿里巴巴集團的大數據營銷推廣平臺。

2007年,阿里媽媽正式上線。據一項數據表明,該平臺每天有超過50億的推廣流量,能完成超過3億件商品的推廣展現。10年以來,阿里媽媽早已成為阿里集團變現的主要來源之一。除了由阿里旗下的優酷、土豆、淘寶、天貓、支付寶、UC瀏覽器、高德地圖等公司聚合而成的全域大數據的助力之外,當然還離不開AI算法在廣告系統中的應用的支持。

說到AI算法,自然免不了蓋坤負責的精準定向檢索及基礎算法團隊的貢獻。該團隊的目的在於幫商家更準確地預測用戶的行為,從而實現更精準的廣告投放。

2011年,剛進阿里的蓋坤提出了分片線性模型MLR,這對當時主要使用簡單線性模型來預測CTR的業界來說,因為極大地提高了CTR預估的準確性而頗具意義。幾年來,MLR模型已經被廣泛應用在直通車定向和鑽展業務中。

近期,蓋坤又帶領團隊在CTR預估方面推出了一個新的模型結構——深層用戶網絡興趣分佈,即利用深度學習在用戶的歷史行為和廣告CTR預估之間建立部分匹配,匹配度越高的歷史數據對預估結果的影響越大。其具體介紹可看雷鋒網此前報道和蓋坤本人在這次CCF-GAIR大會上的演講。

在蓋坤主題演講結束之後,雷鋒網也帶著一些重點問題旋即對其進行了採訪,以下是採訪實錄:

阿里媽媽利用AI算法在廣告業務的應用

雷鋒網:阿里媽媽在把AI算法運用到廣告業務領域都做了哪些工作?取得了哪些成就?

蓋坤:跟機器學習相關的,一個是典型的CTR預估模型。預估模型需要對流量的價值進行拆分和預估,這也是廣告價值售賣的基礎,比如點擊收費、轉化收費、展示位置收費各不一樣。這是阿里媽媽最基礎的一層。

在此之上,還有一些自動化的方法。我們做了一些客戶端的工具,借之賦能廣告主去自由地表達自己的要求。比如,CTR、AOC,質還是量等等,從而實現事前的預估和事後的洞察。這類自動化方法,跟傳統的機器學習不完全一樣,更多還是偏向優化和統籌分化類。這類方法有兩個重點:

其一,事前預估。比如我們會用自動化方法提前把流量和廣告主的價值和匹配度預估出來,從而與客戶目標達成一致,實現定價保量。再對其使用運籌、優化的方法去做事前的分配。

其二,在事中環節採取實時控制策略。因為流量一直隨時間而變化,所以事前不可能實現完美的預估。在此其中,我們運用了很多黑盒測試,也採用一些白盒測試等機智類方式去解決。對於黑盒測試,我們主要集中在強化學習上——即整個序列如何建模能夠達到最終預期目標或者長期收益的最大化。

雷鋒網:現階段在預測CTR的準確性上,主要存在哪些阻礙或限制因素?

蓋坤:CTR預估,在工業界上來說,一般會有AOC等指標,這些指標的上限都挺高的。如,按照AOC的理論上限“1”這點來衡量,實際上在各個公司也就做到0.7或者0.8左右,反正離上限總有個Gap。不過,實際做到什麼程度不僅和技術能力有關,也跟數據特性有關——有的技術本身就難區分,而容易區分的數據能達到的指標相應也就更高一點。

如果我們能百分之百預估CTR準確性的話,淘寶網根本不會給用戶展示其任何不想點的東西,百度也不會給大家展示不需要的信息。

但就現階段而言,理論空間上,大家離這個目標還有很遠的距離,雖然每年技術上都有進步。而在現實應用中,一般是用一套模型的一套方法論加上配套的特徵工程,上下游的處理,以及前後的迭代優化,以讓這個方法論達到一個上限。但是,一種方法論在某個時期都會達到一個上限。

就像我在CCF-GAIR演講中提到的,線性模型本身就有限制,雖然它已經有配套的工程能力和特徵處理能力去補足了這個缺陷,但還是會對其有所制約,所以很難去突破它現在的狀態。如果要說突破的話,更多的要從模型設計變化去做突圍。比如,從線性模型到非線性模型,或者到更復雜的非線性模型。

雷鋒網:與CTR預測準確性緊要相關的,還有圖像素材的識別和投放精準度兩項因素,阿里這邊在圖像素材的投放效果的技術判斷上做到哪一步了?之後會有更深入的計劃嗎?

蓋坤:在這一塊,我們已經做了一套深度興趣神經網絡。對深度興趣神經網絡而言,其傳統的做法可能是直接搬遷,比如Embedding、全連接、CNN、LCM,這些都不是在互聯網大數據下提出來的。雖然可能部分適用,但並不是最適合這個狀態的網絡結構。

剛才在主題演講裡,我已經講了一部分利用該模型做的工作,即我們會根據數據來定製網絡。(雷鋒網注:蓋坤在演講中表示,深度興趣網絡利用深度學習在用戶的歷史行為數據和要預估的廣告之間建立了聯繫,其利用權重調製變成子序列,再在子序列上做Pooling建模,將歷史行為的興趣向量和目標廣告的興趣向量連接起來,通過簡單的多層全連接,從而實現二者的部分匹配,匹配度越高的歷史數據就對CTR預估的結果影響越大。)

後續,阿里還希望利用技術驅動業務本質形式的變化,而不只是效率的提升。目前,我們在做的Uni Marketing 全域營銷,就是希望用戶不管是從淘寶,還是從淘寶關聯的場景,或是從阿里關聯的有關公司,都能和阿里的數據進行持續性的交互。通過前後一致的關係序列,在本質上提升用戶體驗。當然,我們希望能在全域營銷的基礎上去做建模,全面提升用戶的體驗和營銷能力的提升。

雷鋒網:您之前提出來的MLR模型,已經在那些廣告業務領域被應用?

蓋坤:這幾年在直通車定向、鑽展等類型的應用上,都是以MLR為主模型進行迭代,其中模型又包括特徵工程和優化。MLR也是這幾條業務線獲得盈利的主要推動因素之一。

和Google、Facebook和亞馬遜的算法比較

雷鋒網:就Google、Facebook和亞馬遜三家巨頭而言,他們在測量CTR的準確性上也做了很多努力,在您看來,阿里媽媽的測量算法和他們相比,側重點有何不同?存在哪些優勢和劣勢?

蓋坤:先舉一個例子:目前國內的移動支付比很多國家做的都好。但是前幾年的信用卡時代,中國是遠遠落後於國外的。

同理類推到CTR算法上,我個人認為,這反而是阿里的一個機會。前幾年,尤其是在邏輯迴歸時代,很多公司積累的算法功力都是很高的。但是在新的浪潮裡,中國在深度學習的改造上,在業界來說還比較新。所以,我們希望能夠像移動支付一樣,找到趕超的機會。而阿里的優勢在於,其負擔更小,所以前進的更快。

目前來看,在CTR預估技術的提升這一塊,阿里在非線性模型裡已經比較領先了。

雷鋒網(公眾號:雷鋒網):看大家在知乎上的討論,普遍認為亞馬遜的推薦算法更好,您作為專業人士,怎麼看待這樣一個觀點?阿里和亞馬遜相比呢?

蓋坤:推薦算法其實應該是另一個部門在負責,我主要在精準廣告技術這一塊。就阿里整個業務形式而言,其實對廣告變現還不那麼急迫。所以在預期的業務走向上會更加正向,更重要的還是在商業化土地上先做好技術算法和變現能力。而且,現階段推薦算法的商業化率在推薦場景裡並不夠。

說到和亞馬遜的比較,核心來講還是要聚焦在指標定義上。我們原先定的指標維度會稍微單一一點。目前來看,我們對指標也在慢慢拆解。這個拆解包括對業務的認知,即到底什麼是用戶體驗,認知背後也需要技術能力。其實用戶體驗並非直接反應在數據裡,它需要從中去學習和抽取。

而推薦算法上來講,大家其實都差不太多,但是有的在指標優化的專注度上來講會更高,這樣也直接造成用戶體驗上的偏差。

阿里和亞馬遜相像的地方在於。不僅是在高舉未來的AI或雲計算的目標,也會就目前正在使用的業務領域會去做一些新技術的結合。

那些問題

相關推薦

推薦中...