愛奇藝CTO湯興:未來的娛樂是AI娛樂

至頂網軟件頻道消息: 愛奇藝正在用AI分析海量內容和用戶行為,實現內容管理、創作以及理解用戶意圖等多方面複雜的、難以人工完成的工作。愛奇藝CTO湯興稱其為“AI娛樂”。

愛奇藝CTO湯興:未來的娛樂是AI娛樂

6月9日,愛奇藝世界·大會第二天,湯興博士分享了愛奇藝的技術戰略及佈局,並正式公佈設立創新實驗室,將通過國際合作制定視頻行業的AI標準,引領AI娛樂時代的視頻行業變革。這也將是愛奇藝“做一家以科技創新為驅動的偉大娛樂公司”的願景得以實現地堅實一步。

湯興在主題演講中結合愛奇藝的創新實踐,詳細闡釋了AI對於視頻網站的價值。“海量的內容、用戶、以及強大的雲計算能力促進了快速迭代到AI娛樂時代的進程。”湯興表示,愛奇藝今天的數據量相當於十年前全球網站流量總和。在七年的發展歷程中,愛奇藝始終重視數據的價值,不斷利用新技術探索視頻網站的邊界,努力提升用戶體驗,並憑此吸引著更多用戶,搭建了以技術為驅動的AI娛樂生態。

愛奇藝很早便開始了AI技術的佈局,作為連接內容和用戶的中間橋樑,全方位解析兩端的數據,讓AI技術在內容端輔助視頻創作,在用戶端提供創新的應用和個性化的服務,同時提升網站的運營效率。經過持續的探索,愛奇藝開發了多個以AI技術驅動的創新應用,在提升用戶體驗的同時,拓展了商業化的空間。利用自然語言處理、圖形圖像識別技術,解析網站視頻、圖像、文本信息,能全面提升網站的智能化。

湯興表示:“對每個娛樂公司來說,內容和用戶永遠是一個二元體,我們既要理解內容,同時也要理解用戶,這也是與傳統媒體和新媒體最大的區別,我們能夠給用戶更多的選擇以及更多的交互的方式。”

互聯網思維的核心是確保用戶體驗,在愛奇藝的視頻平臺上,為每一個用戶提供差異化的服務是愛奇藝一直努力的方向。但是,在這個領域,給視頻起標題可並不像想象的那麼簡單。

首先,需要理解視頻內容,還需要對整個視頻進行思維概括和抽象的能力。在去給視頻起標題之前,可能需要事先了解的就是這個視頻內容,進一步進行切分,並對這些視頻標註一些智能化的標籤,讓用戶理解這個視頻究竟是屬於哪個分類,是關於什麼的。而這其實是後期個性化視頻推薦最堅實的基礎。

此外,未來AI還將輔助內容創作者來創作內容。湯興表示:“我們知道匠心不可複製,但是優質的內容通過AI可以幫它挑選出真正優秀的情節。”據介紹,愛奇藝通過獨有的濾鏡技術,將用戶的播放量、互動量、整個社交傳播的方式,包括對明星、場景的分析,自動的把優秀的片斷提取出來,並打上智能標籤,通過用戶觀看行為後期的範圍,以及語義分析能夠自動生成短視頻。

不僅如此,利用AI技術,湯興連接內容和用戶,提出了“AI藝術家”的概念,開發了“智能剪輯”功能,能讓系統找到長視頻中具有價值的劇情點。還開發了神奇的”三維換臉“功能,通過人臉建模讓任何人都能成為”演員“。

在用戶端,通過分析用戶行為數據,愛奇藝得以全面瞭解用戶,更好地進行輿情分析、個性化推薦,以及受眾洞察。湯興介紹道:“我們通過用戶大量的行為,包括消費充值、互動、搜索播放,通過意圖識別、行為建模和機器學習最終進行了完善的輿情分析,通過給用戶推薦個性化的內容和相應的反饋,並模擬出了精準的用戶畫像。”

值得一提的是,利用深度學習等技術,愛奇藝開發了一套具備票房、流量、收入等預測能力的商業智能系統,輔助影視投資和版權採買行為,極大的保證了投資回報率。得益於對AI技術的深度挖掘,愛奇藝提升了產品體驗,並打通了內容端、用戶端的產業鏈資源,實現合作共榮。

以下是演講實錄:

大家好!歡迎大家光臨愛奇藝世界大會智能視頻分論壇。我今天的演講主題是“AI娛樂”。我們知道,現在回顧整個數字化娛樂的演進史,從最早的VCR、DVD,到數字視頻的下載,到PC互聯網時代,到最近移動互聯網時代,整個數字視頻的演進史也代表了整個數字化娛樂的演進史。那麼,隨著內容的極大豐富,用戶量的極大增加,下一代娛樂會向哪裡發展?我們認為是未來的AI娛樂。我們看一下這個數字娛樂的演進史,它體現出來的幾個最重要的特徵。

第一,內容的極大豐富。我們知道以前的傳統媒體用戶只能去被動的接受,現在用戶有了更加多的選擇,無論是內容豐富的形式:從直播到點播,到圖文,到長圖文,到投票,到話題,包括整個網大、網劇、電影,也有各種各樣新的創業方式,導致內容變成了海量。同時,在這個過程中,用戶接受內容的方式也有了很大的變遷。最早我們接受內容的方式基本上都是通過內容被動的push,電視臺放什麼節目,媒體放什麼文章,我們會去接受什麼樣的內容。現在需要更多的個性化,需要在浩瀚的內容海洋當中去找尋。同時現在的形態也越來越多,無論是VR、AR,還是4K,包括杜比全景聲,各種創新的內容形態也越來越多。同時,我們解決了以前很難解決的一個問題,最早的傳統媒體的變現方式都是通過傳統的品牌廣告,傳統的基於內容的CPD的廣告,而現在我們通過信息流廣告的形式,其實我們打開了以前一扇變現的大門。以前傳統的、浩瀚的,以短視頻為主的垃圾流量可以變現,變成一個真正的金礦。

那麼,愛奇藝其實在這次的世界大會重新更新了我們的企業願景,我們說要做一家以科技創新為驅動的偉大的娛樂公司。那麼,科技創新怎麼樣驅動一家娛樂公司?我們知道,現在在移動互聯網時代,愛奇藝已經變成了整個領域的第一名,我們每天移動端的DAU,上個月的數據,昨天龔總都已經公佈了,在整個中國的移動互聯網領域我們是毫無疑問的第一名。同時,我們整個月度的DAU,在整個視頻行業排名第一;整個時長在中國互聯網排名第二,僅次於微信。同時,其實可能大家還有一個不知道的,經過兩年的默默耕耘,愛奇藝上的泡泡社區也變成最大的娛樂的粉絲社區,目前DAU已經達到6000萬。

那麼,隨著這麼大的海量的用戶,那麼長的時長和海量的粉絲,我們如何以海量的內容、用戶,以強大的雲計算能力促進AI時代的發展。愛奇藝走在了行業的前端。

但是,同時我們認識到,對每個娛樂公司來說,內容和用戶永遠是一個二元體,我們既要理解內容,同時要理解用戶,而傳統媒體和新媒體最大的區別是我們能夠給用戶更多的選擇,能夠給用戶更多的交互的方式。那麼,我們真正認識到,科技只有和人文、藝術相結合才能綻放它的生命力。

下面讓我和大家一起回顧一下愛奇藝這幾年在AI方面所做的所有工作。

我們知道AI所有核心是為了理解內容,理解用戶,同時通過運營,把二元體融為一體。那麼,愛奇藝由於有了龐大的內容,又有海量用戶的行為,讓我們通過智能理解用戶的行為和意圖,以及智能地理解內容來更好的創作更多的內容,更好的服務用戶,同時也能更好的提升我們的運營效率。下面我會通過內容、用戶、運營效率方面闡述我們在智能行業做的這些工作。

我們知道整個互聯網的發展是從文本開始的,對人的交互來說,文本是一個最簡單的方式,更多的現在用戶的交互還是通過鍵盤,通過鼠標。首先,我們要理解用戶文本的輸入。

首先,我們看這個例子,“鹿晗演繹帥氣陳長生,逆天改命擇天記終迎結局”,我們知道陳長生是鹿晗演的一個角色,擇天記是一個劇的名字,愛奇藝的大腦真正能夠以人類的方式理解這句話,從而能夠在搜索中給出用戶真正想要的結果。那麼,通過對文本分析的理解,在愛奇藝的搜索引擎裡面你是可以搜這樣的詞語的,搜索李晨女友演過的電影是哪些,都是范冰冰演的。當我們理解完文本之後,接下來對我們最大的挑戰其實是理解視頻本身。我們知道視頻是由鏡頭組成的,電影的拍攝模式是導演拍攝不同的鏡頭,做不同的組合。反過來當我們理解這個視頻的時候,我們要把視頻分解成不同的鏡頭,每個鏡頭分解成不同的畫面,以此真正理解這個視頻本身。

首先大家耳聞目染的就是人臉識別,這個在各個行業都非常多的應用,我們也做了關於娛樂、人物所有的人臉識別。但是,隨之衍生的因為通過鏡頭的理解和切割,通過各種不同鏡頭之間的關係,當人臉被遮擋,或者人在背過身去,或者在昏暗環境時候我們的鏡頭識別,我們依然可以追蹤一個演員,它有什麼用處?我們有一個新的產品會上線,我們能夠讓一個用戶在視頻裡只看某一個演員出現的場景,能夠分析出電視劇中每一部劇這個人出現的時長,由此你能知道當前戲份最長的演員是誰,每個用戶觀看他的時長是多久。

同樣,我們能夠分析每個人的一些屬性,無論他的高矮、胖瘦、髮型、性別,這樣我們可以對人群做一個區分,以及可以用來做後續的商業。當然人有七情六慾,當我們用機器理解人的時候首先要理解他的七情,當然我們不希望他有六慾。愛奇藝在情感識別上也花了很大的工作,我們團隊在去年兩次國際的頂尖的情感大賽上獲得了桂冠。我們可以識別他高興、恐懼、驚訝、悲傷、生氣,甚至可以進而識別他的所有行為,他在擁抱,還是在親吻,還是在跳舞,還是在吃飯,還是在化妝,我們通過這種行為分析,把原來分佈在各個地方關於某個人的各種行為融為一體誕生一個新的視頻,這是後面我要講的AI如何輔助內容的創作。除了我剛才所說的,甚至還有他所處的場景和地點,這個可以用來做旅遊相關的導購,包括時間,包括天氣,甚至剛剛發佈了對白的識別。

愛奇藝可以通過AI技術的幫助讓整個愛奇藝視頻搜索變成全世界最大的中文視頻搜索引擎,我們每天的分發量超過3億。我們第一次發佈了以圖搜劇的功能,今天在愛奇藝可以直接把這個圖片輸進去,或者拍下來,能夠直接找到這個圖片出現的影片以及出現的時間戳,點進去之後可以從這個時間戳開始觀看,目前我們已經收錄了超過4萬小時的電影、電視劇、綜藝等視頻內容,當然你也可以說我們去搜索經典的臺詞,像以前《大話西遊》裡經典的臺詞。

那麼,隨著AI對內容的理解,使我們進一步可以對視頻進行一個描述。因為我們知道最難的是什麼?現在在這個行業最難的是給一個視頻起標題。因為它不光需要你去理解視頻內容,還需要你要有整個概括思維和抽象的能力。在去給視頻起標題之前,可能需要事先了解的就是這個視頻內容,進一步的開始切分,給它打一些智能化的標籤,讓你理解這個視頻究竟是屬於哪個分類,是關於什麼的。而這其實是後期個性化視頻推薦最堅實的基礎。

現在在愛奇藝有一個成熟化的標籤標註系統,通過把視頻進行鏡頭的拆分,然後對鏡頭進行進一步的分類,然後進行我剛才所說的各種屬性的識別,從此生成一個標籤的各種識別,然後進行測試,給每個標籤打上執行度,以此對後期的所有工作打下堅實的基礎。下面看一個視頻,這個綠色的是當前執行度最高的標籤,它會自動識別出當前這個場景裡最重要的標籤是什麼,以及這個標籤的執行度相對其他標籤哪一個更加可靠。

我們知道當我們識別了一個視頻之後,我們需要理解的是用戶,因為每個用戶會喜歡不同的視頻,尤其現在短視頻開始爆發,當內容海量的情況下,人的消耗,整個視頻的時長几乎是固定的。那麼,每個愛奇藝的用戶幾乎在愛奇藝每天會消耗大概100-150分鐘。當他的時長固定的時候,他需要更多的是去消費他感興趣的內容,而不希望把時間花費在他對內容的尋找上。那麼,我們通過用戶大量的行為,包括他的消費充值、互動、搜索播放,通過意圖識別,行為建模和機器學習最終進行了完善的輿情分析,通過給用戶推薦個性化的內容和相應的反饋,我們最終也模擬出了精準的用戶畫像。

這次我們也會發佈一個新的愛奇藝的產品叫“愛奇藝指數”。通過“愛奇藝指數”你可以看到所有內容在愛奇藝上播放的數據的整體分類和挖掘的情況。我們看一個例子,《歡樂頌》,首先可以看到播放量的分佈,在移動端佔比多少,在PC端佔比多少。也可以看到整個地域的分佈,到底哪個地區的人更喜歡看這部影片。同時經過AI標籤的分析,能夠知道在這部電視劇裡面哪一個場景出現得最多,我們也能知道用戶最喜歡的是哪些場景。

同時,我們能夠知道每個明星在這部視頻中出現的時長,而它真正反映了用戶對這個明星的感知到底有多長。由此誕生了另外一個產品——明星排行榜。我們不光要分析用戶的觀看數據和整個互動數據,我們還希望知道他在社交網絡中對這個內容的評價,以及他們關心的著重點,我們有相應的輿情分析的工具。比如《歡樂頌》,大家更關心樊勝美、小曲、安迪,這些輿情的分析能夠幫助內容創作者和宣發的工作人員進行有效的人群的定向和內容的宣發。現在我們把“愛奇藝指數”會集中在愛奇藝號的平臺中,未來所有的內容生產者都可以通過這個指數看到所有內容消費的情況。

還有關於觀眾的分析,直接過了。前面講的都是理解內容,後面我們講的是創作,傳統的藝術家創作內容是通過對用戶的理解選擇符合這個用戶群的內容。同時,當他創作出內容之後讓用戶來消費。那麼,未來AI如何輔助內容創作者來創作內容是我們需要研究的方向。我們知道匠心不可複製,但是優質的內容通過AI可以幫它挑選出真正優秀的情節。在短視頻爆發的時代,怎麼從原來浩瀚的長視頻中挑選出用戶真的感興趣的短視頻推給用戶,現在非常火的是5分鐘看一部電影,3分鐘看一個故事,未來怎麼自動化的產生這些短視頻,因為我們知道短視頻的產生需要很強的製作能力。我們有浩瀚的長視頻內容,愛奇藝有獨有的濾鏡技術,通過對用戶的播放量,互動量,整個社交傳播的方式,包括對明星,對場景的分析,可以自動的把優秀的片斷提取出來,通過給它打上智能標籤,通過用戶觀看行為後期的範圍,以及語義分析能夠自動生成短視頻。

同時,我們也生成了一些好玩的東西,在泡泡社區裡,很多人都有當明星的夢,利用3D建模上傳一張照片。我們知道內容的採購和創作,以及它的宣發影響了最終內容整個的變現成本。那麼,愛奇藝在內容採購中很早以前就做了很多工作,我們怎麼樣通過我們對流量的預測來輔助我們的採買人員買更精準的劇。這也導致了愛奇藝我們內容的採買在行業中是領先的。同時,當你採購來一個劇的時候怎麼做宣發直接有效,是鋪天蓋地的鋪戶外廣告,還是社交網絡傳播,還是精準的在社會群體中進行傳播,我們會有精準的娛樂分析和輿情分析幫助他們做決策,同時事後我們可以分析這個視頻到底哪個環節做得好還是不好。

看VV預測,基於深度學習的多時間窗口。另外,我們也知道數據是一個平臺的生命,而數據的真實性其實是一個視頻平臺、一個娛樂平臺存在的根本。因為各種各樣的原因,這個行業總是會出現一些作弊的流量,我們2014年開始建立了強大的反作弊系統,通過實時防控系統,然後到後期的異常流量的在線和線下異常流量的清楚,我們保證了這個平臺的真實性。

我剛才講的是我們在內容、用戶,以及我們在相應的運營手段中所做的所有工作,怎麼樣通過AI真正幫助視頻行業改變以前以人為主的運營方式、以人為主的創作方式,和以人為主的理解方式。今天在所有的部門中我們被稱為愛奇藝大腦,我們通過和很多業界一流的機構和合作夥伴的合作,包括百度、英特爾、自動化所、中科大、杜比、Media,包括山東大學的合作,在視頻的ARP文字理解,視頻本身,音頻的理解,過一會兒John Couling也會講一下杜比在音頻方面的工作,同時在商業技能方面的發展,我們在更加地促進AI在整個娛樂行業中的發展。

我們知道AI最強的需求是第一要有強大的數據;第二,要有強大的計算量;第三,要有真實的行業的前景。AI最終一定要通過行業落地,愛奇藝希望我們在AI方面的工作能夠沉浸在整個在娛樂方面的工作過程中,藉此我們也成立了愛奇藝創新實驗室,把整個愛奇藝的音頻、視頻、商業智能、文本的研發團隊合為一體,同時通過和業界各方面的合作,我們希望這個創新實驗室能夠變成整個娛樂AI方面工作的一個推動力,能夠推動整個娛樂行業向AI娛樂發展。

我們通過AI讓機器有了理解人的能力,讓機器有了溫度。同時,我們也通過AI讓愛奇藝更加的瞭解我們的用戶,讓愛奇藝更加了解用戶的情感,讓愛奇藝更加有溫度。那麼,未來我們希望AI能讓愛奇藝變成一個更加善良有溫度的娛樂平臺,能夠讓更多的用戶在愛奇藝上找到消費、互動,他們最喜歡的視頻,愛奇藝,愛娛樂,我今天的演講到此為止,謝謝大家!

相關推薦

推薦中...