"


"


國內首份內容產業智能化報告:AI與5G技術驅動下的內容產業變革

我們理解的數字內容,是所有內容的數字化,包括文本、圖像、音頻、視頻等內容載體形式。5G 的發展會進一步促進內容生產與傳播形式的演變,未來所有智能設備終端都會成為數字內容的信源或推送終端,有屏就有數字內容。

但在數字內容這一新興產業集群的生產鏈條裡,我們需要考察的不僅是業態、生態,更需要結合政策、法律、安全性等多類因素,全方位地去認識技術賦予內容產業全新的發展機遇。

8 月 30 日,在由賽博研究院承辦,騰訊、上海社科院互聯網研究中心等聯合協辦的 2019 世界人工智能安全高端對話上,騰訊安全戰略研究中心聯合賽博研究院重磅發佈《人工智能時代數字內容治理的機遇與挑戰》報告。該報告也是國內首份聚焦人工智能與數字內容行業關係,全景式地呈現了數字內容產業發展趨勢、挑戰風險、政策創新、治理賦能。

蓬勃發展的數字內容產業是前沿數字化信息技術與文化創意內容高度融合的產物,天然兼具科技與文化兩種屬性,是互聯網時代人類文化的主要載體和社交傳播的內核,甚至凝聚各個共同體的理念價值, 將創造新的個體精神世界。

數字內容產品/服務以多種載體形式呈現,基於各類數字化平臺廣泛傳播,並不斷延伸到其他垂直行業,比如涉及到數字出版、數字廣播、數字電視、數字電影、數字音樂、數字動漫、數字遊戲等多個細分行業,也關聯到數字內容產品與服務的生產(UGC、PGC 等)、研發、經營、傳輸、技術支持等產業綜合體的多項複雜環節。

人工智能與數字內容發展相輔相成。人工智能促進了數字內容產業迭代演進,數字內容產業也成為人工智能技術發揮其作用的主要場景之一,甚至成為信息技術研發應用的重要導向。

以數字內容發展為例,基於專家系統(Expert System,ES)的「媒體大腦」等應用,能夠對海量異構數據進行高效的預處理和標準化管理,管理內容資源庫,充分挖掘內容素材和文化創意;自然語言處理(Natural Language Processing,NLP)和計算機視覺 (Computer Vision,CV) 能夠完成對各種形式和場景下數字內容含義的辨識理解,實現內容的精準匹配和個性化定製;機器學習 (Machine Learning,ML) 技術在對內容主體進行要素畫像和標籤設定方面表現突出,使得數字內容突破媒介限制,充分延伸到消費者和其他產業等。

同時,AI、5G、大數據、雲計算、物聯網等各類先進數據智能、網絡基礎設施的新技術交織融合,為數字內容應用與服務提供了創新擴容支持,以全程媒體、全息媒體、全員媒體、全效媒體為代表的全媒體將崛起發展,未來,萬物互聯、萬物皆媒,萬物成為數字內容的載體和出口。

"


國內首份內容產業智能化報告:AI與5G技術驅動下的內容產業變革

我們理解的數字內容,是所有內容的數字化,包括文本、圖像、音頻、視頻等內容載體形式。5G 的發展會進一步促進內容生產與傳播形式的演變,未來所有智能設備終端都會成為數字內容的信源或推送終端,有屏就有數字內容。

但在數字內容這一新興產業集群的生產鏈條裡,我們需要考察的不僅是業態、生態,更需要結合政策、法律、安全性等多類因素,全方位地去認識技術賦予內容產業全新的發展機遇。

8 月 30 日,在由賽博研究院承辦,騰訊、上海社科院互聯網研究中心等聯合協辦的 2019 世界人工智能安全高端對話上,騰訊安全戰略研究中心聯合賽博研究院重磅發佈《人工智能時代數字內容治理的機遇與挑戰》報告。該報告也是國內首份聚焦人工智能與數字內容行業關係,全景式地呈現了數字內容產業發展趨勢、挑戰風險、政策創新、治理賦能。

蓬勃發展的數字內容產業是前沿數字化信息技術與文化創意內容高度融合的產物,天然兼具科技與文化兩種屬性,是互聯網時代人類文化的主要載體和社交傳播的內核,甚至凝聚各個共同體的理念價值, 將創造新的個體精神世界。

數字內容產品/服務以多種載體形式呈現,基於各類數字化平臺廣泛傳播,並不斷延伸到其他垂直行業,比如涉及到數字出版、數字廣播、數字電視、數字電影、數字音樂、數字動漫、數字遊戲等多個細分行業,也關聯到數字內容產品與服務的生產(UGC、PGC 等)、研發、經營、傳輸、技術支持等產業綜合體的多項複雜環節。

人工智能與數字內容發展相輔相成。人工智能促進了數字內容產業迭代演進,數字內容產業也成為人工智能技術發揮其作用的主要場景之一,甚至成為信息技術研發應用的重要導向。

以數字內容發展為例,基於專家系統(Expert System,ES)的「媒體大腦」等應用,能夠對海量異構數據進行高效的預處理和標準化管理,管理內容資源庫,充分挖掘內容素材和文化創意;自然語言處理(Natural Language Processing,NLP)和計算機視覺 (Computer Vision,CV) 能夠完成對各種形式和場景下數字內容含義的辨識理解,實現內容的精準匹配和個性化定製;機器學習 (Machine Learning,ML) 技術在對內容主體進行要素畫像和標籤設定方面表現突出,使得數字內容突破媒介限制,充分延伸到消費者和其他產業等。

同時,AI、5G、大數據、雲計算、物聯網等各類先進數據智能、網絡基礎設施的新技術交織融合,為數字內容應用與服務提供了創新擴容支持,以全程媒體、全息媒體、全員媒體、全效媒體為代表的全媒體將崛起發展,未來,萬物互聯、萬物皆媒,萬物成為數字內容的載體和出口。

國內首份內容產業智能化報告:AI與5G技術驅動下的內容產業變革

表 1 互聯網時代與人工智能時代數字內容產業比較

美國標普公司的報告顯示,全球數字內容產業的直接總產值在 2018 年達到 1896 億美元,預計到 2025 年底將達到 3438 億美元。我國國家統計局數據顯示,2017 年,以「互聯網+」為主要形式的文化信息傳輸服務業營業收入 7990 億元,增長 34.6%。

另據我國工信部統計,2017 年我國以 IP 為核心的網絡文學、動漫、影視、遊戲和音樂等泛娛樂產業約為 5484 億元,同比增長 32%,佔數字經濟的比重超過 20%。

互聯網用戶規模特別是移動用戶的快速増長為數字內容產業的發展提供了核心動力,催生了短視頻、AI 直播、VR、AR 等新興業態,以及基於算法推薦的個性化信息服務商業模式。

從用戶規模看,我國網民使用率最高的 TOP10 互聯網應用中,80% 以上的應用與數字內容產業直接相關,平均用戶規模超過 6 億。從具體行業看,網絡視頻、網絡遊戲已成為數字內容產業中的熱點領域;社交媒體繼續保有數字內容產業產值和用戶數量領先的地位;短視頻、網絡直播和垂直知識平臺增長迅猛,投資火熱;數字音樂市場快速增長,全球付費訂閱音樂服務的營收也增長到了 34.98 億美元;虛擬現實和增強現實(VR/AR)技術改變了數字內容產業的產品形態和傳播方式,在新聞、旅遊、娛樂等領域紛紛落地應用。

1 數字內容產業呈現六大發展趨勢

數字內容產業整體發展趨勢體現為縱向延伸、垂直整合、跨界佈局、生態融合,行業邊界逐漸消弭,數字內容產業催生新的社會化分工,孵化出新的產業價值體系,在內容生產、傳播、消費、載體、質量、安全等各環節或方面呈現出六大發展趨勢。


"


國內首份內容產業智能化報告:AI與5G技術驅動下的內容產業變革

我們理解的數字內容,是所有內容的數字化,包括文本、圖像、音頻、視頻等內容載體形式。5G 的發展會進一步促進內容生產與傳播形式的演變,未來所有智能設備終端都會成為數字內容的信源或推送終端,有屏就有數字內容。

但在數字內容這一新興產業集群的生產鏈條裡,我們需要考察的不僅是業態、生態,更需要結合政策、法律、安全性等多類因素,全方位地去認識技術賦予內容產業全新的發展機遇。

8 月 30 日,在由賽博研究院承辦,騰訊、上海社科院互聯網研究中心等聯合協辦的 2019 世界人工智能安全高端對話上,騰訊安全戰略研究中心聯合賽博研究院重磅發佈《人工智能時代數字內容治理的機遇與挑戰》報告。該報告也是國內首份聚焦人工智能與數字內容行業關係,全景式地呈現了數字內容產業發展趨勢、挑戰風險、政策創新、治理賦能。

蓬勃發展的數字內容產業是前沿數字化信息技術與文化創意內容高度融合的產物,天然兼具科技與文化兩種屬性,是互聯網時代人類文化的主要載體和社交傳播的內核,甚至凝聚各個共同體的理念價值, 將創造新的個體精神世界。

數字內容產品/服務以多種載體形式呈現,基於各類數字化平臺廣泛傳播,並不斷延伸到其他垂直行業,比如涉及到數字出版、數字廣播、數字電視、數字電影、數字音樂、數字動漫、數字遊戲等多個細分行業,也關聯到數字內容產品與服務的生產(UGC、PGC 等)、研發、經營、傳輸、技術支持等產業綜合體的多項複雜環節。

人工智能與數字內容發展相輔相成。人工智能促進了數字內容產業迭代演進,數字內容產業也成為人工智能技術發揮其作用的主要場景之一,甚至成為信息技術研發應用的重要導向。

以數字內容發展為例,基於專家系統(Expert System,ES)的「媒體大腦」等應用,能夠對海量異構數據進行高效的預處理和標準化管理,管理內容資源庫,充分挖掘內容素材和文化創意;自然語言處理(Natural Language Processing,NLP)和計算機視覺 (Computer Vision,CV) 能夠完成對各種形式和場景下數字內容含義的辨識理解,實現內容的精準匹配和個性化定製;機器學習 (Machine Learning,ML) 技術在對內容主體進行要素畫像和標籤設定方面表現突出,使得數字內容突破媒介限制,充分延伸到消費者和其他產業等。

同時,AI、5G、大數據、雲計算、物聯網等各類先進數據智能、網絡基礎設施的新技術交織融合,為數字內容應用與服務提供了創新擴容支持,以全程媒體、全息媒體、全員媒體、全效媒體為代表的全媒體將崛起發展,未來,萬物互聯、萬物皆媒,萬物成為數字內容的載體和出口。

國內首份內容產業智能化報告:AI與5G技術驅動下的內容產業變革

表 1 互聯網時代與人工智能時代數字內容產業比較

美國標普公司的報告顯示,全球數字內容產業的直接總產值在 2018 年達到 1896 億美元,預計到 2025 年底將達到 3438 億美元。我國國家統計局數據顯示,2017 年,以「互聯網+」為主要形式的文化信息傳輸服務業營業收入 7990 億元,增長 34.6%。

另據我國工信部統計,2017 年我國以 IP 為核心的網絡文學、動漫、影視、遊戲和音樂等泛娛樂產業約為 5484 億元,同比增長 32%,佔數字經濟的比重超過 20%。

互聯網用戶規模特別是移動用戶的快速増長為數字內容產業的發展提供了核心動力,催生了短視頻、AI 直播、VR、AR 等新興業態,以及基於算法推薦的個性化信息服務商業模式。

從用戶規模看,我國網民使用率最高的 TOP10 互聯網應用中,80% 以上的應用與數字內容產業直接相關,平均用戶規模超過 6 億。從具體行業看,網絡視頻、網絡遊戲已成為數字內容產業中的熱點領域;社交媒體繼續保有數字內容產業產值和用戶數量領先的地位;短視頻、網絡直播和垂直知識平臺增長迅猛,投資火熱;數字音樂市場快速增長,全球付費訂閱音樂服務的營收也增長到了 34.98 億美元;虛擬現實和增強現實(VR/AR)技術改變了數字內容產業的產品形態和傳播方式,在新聞、旅遊、娛樂等領域紛紛落地應用。

1 數字內容產業呈現六大發展趨勢

數字內容產業整體發展趨勢體現為縱向延伸、垂直整合、跨界佈局、生態融合,行業邊界逐漸消弭,數字內容產業催生新的社會化分工,孵化出新的產業價值體系,在內容生產、傳播、消費、載體、質量、安全等各環節或方面呈現出六大發展趨勢。


國內首份內容產業智能化報告:AI與5G技術驅動下的內容產業變革


1. 內容生產:「人-機」協同的智能化生產模式將廣泛應用

機器將替代信息挖掘、數據檢索、媒體資源管理等基礎性機械勞動,進一步解放媒體工作者勞動力。

2. 內容傳播:算法精準推薦佔據信息流分發主導地位

算法能夠實現進行數字內容聚合和精準推薦,快速匹配信息與人。比如,智能機器人可以用於跨語言、跨業態的溝通和搜索信息,情感識別技術可幫助改變僵硬固化的標籤設置,使定推更加感性和靈活。

3. 內容消費:沉浸式體驗與交互式反饋提供個性化選擇

可消費的內容形式將拓展至 VR、AR、MR、立體影像、智能音響等搭載智能交互功能後形成的沉浸式體驗產品/服務;數字內容消費反饋的實時性隨之增強,生產者與用戶間信息交互無處不在;用戶將在數字內容消費中扮演更為主動的角色,參與到數字內容的文化創意、內容生產過程中。泛娛樂業與媒體行業勢必會使用更廣泛的人工智能技術以為用戶日益增長的對更佳的沉浸式體驗與交互式反饋的需求提供更多個性化選擇。

4. 內容載體:萬物皆媒環境中數字內容嵌入各類行業場景

新技術普及應用將帶來巨大的數據量和廣泛的連接終端,人工智能保證了海量異構數據的高效和有效轉化。萬物互聯、萬物皆媒的未來,金融、家居、汽車、教育、醫療等各類場景均正在或將成為數字內容新的載體、傳播渠道和信息終端。此外,人工智能在知識產權保護、數字營銷、廣告宣傳等各領域均有應用,極大地拓展了數字內容的外延。

5. 內容質量:「內容為王」成為數字內容產業核心競爭力

用戶面對爆炸式增長的海量信息難免無從甄別,各類軟文廣告、虛假新聞和不良信息不斷侵害用戶的時間線;數字內容的生產者與用戶間的界限日漸模糊為治理帶來更多複雜性和不確定性;基於人工智能的智能生產和精準匹配仍存很大提高空間,多種因素導致當下數字內容質量良莠不齊。

在此背景下,人們的消費數字內容的核心需求將升級為對優質內容的深度體驗,更具創意的成熟內容以及更為合理的商業模式,成為未來數字內容產業的核心競爭力。

6. 內容安全:各類治理難題凸顯,機遇與挑戰長期並存

一方面,固有頑疾與新生挑戰交織,風險複雜泛化,傳統監管模式滯後於產業新業態,各類風險不斷衝擊著現有法律政策體系和公眾道德認知,很大程度制約了數字內容產業的優質發展。

另一方面,風險挑戰本身亦是安全應用的廣闊發展前景,對人工智能技術本身的優化,以及對其在治理各環節應用的積極探索,能夠為治理機制的完善提供技術支撐,保障數字內容產業健康高質量發展。

2 AI 與數字內容交織引發七大風險

人工智能助推數字內容產業顛覆性發展,難免伴隨著現有治理模式及監管體系與新業態的不匹配,既存在現行治理手段滯後帶來的治理失效和力不從心,也體現為數字內容治理問題與其他社會問題及風險的交織泛化,主要風險包含以下七大類:


"


國內首份內容產業智能化報告:AI與5G技術驅動下的內容產業變革

我們理解的數字內容,是所有內容的數字化,包括文本、圖像、音頻、視頻等內容載體形式。5G 的發展會進一步促進內容生產與傳播形式的演變,未來所有智能設備終端都會成為數字內容的信源或推送終端,有屏就有數字內容。

但在數字內容這一新興產業集群的生產鏈條裡,我們需要考察的不僅是業態、生態,更需要結合政策、法律、安全性等多類因素,全方位地去認識技術賦予內容產業全新的發展機遇。

8 月 30 日,在由賽博研究院承辦,騰訊、上海社科院互聯網研究中心等聯合協辦的 2019 世界人工智能安全高端對話上,騰訊安全戰略研究中心聯合賽博研究院重磅發佈《人工智能時代數字內容治理的機遇與挑戰》報告。該報告也是國內首份聚焦人工智能與數字內容行業關係,全景式地呈現了數字內容產業發展趨勢、挑戰風險、政策創新、治理賦能。

蓬勃發展的數字內容產業是前沿數字化信息技術與文化創意內容高度融合的產物,天然兼具科技與文化兩種屬性,是互聯網時代人類文化的主要載體和社交傳播的內核,甚至凝聚各個共同體的理念價值, 將創造新的個體精神世界。

數字內容產品/服務以多種載體形式呈現,基於各類數字化平臺廣泛傳播,並不斷延伸到其他垂直行業,比如涉及到數字出版、數字廣播、數字電視、數字電影、數字音樂、數字動漫、數字遊戲等多個細分行業,也關聯到數字內容產品與服務的生產(UGC、PGC 等)、研發、經營、傳輸、技術支持等產業綜合體的多項複雜環節。

人工智能與數字內容發展相輔相成。人工智能促進了數字內容產業迭代演進,數字內容產業也成為人工智能技術發揮其作用的主要場景之一,甚至成為信息技術研發應用的重要導向。

以數字內容發展為例,基於專家系統(Expert System,ES)的「媒體大腦」等應用,能夠對海量異構數據進行高效的預處理和標準化管理,管理內容資源庫,充分挖掘內容素材和文化創意;自然語言處理(Natural Language Processing,NLP)和計算機視覺 (Computer Vision,CV) 能夠完成對各種形式和場景下數字內容含義的辨識理解,實現內容的精準匹配和個性化定製;機器學習 (Machine Learning,ML) 技術在對內容主體進行要素畫像和標籤設定方面表現突出,使得數字內容突破媒介限制,充分延伸到消費者和其他產業等。

同時,AI、5G、大數據、雲計算、物聯網等各類先進數據智能、網絡基礎設施的新技術交織融合,為數字內容應用與服務提供了創新擴容支持,以全程媒體、全息媒體、全員媒體、全效媒體為代表的全媒體將崛起發展,未來,萬物互聯、萬物皆媒,萬物成為數字內容的載體和出口。

國內首份內容產業智能化報告:AI與5G技術驅動下的內容產業變革

表 1 互聯網時代與人工智能時代數字內容產業比較

美國標普公司的報告顯示,全球數字內容產業的直接總產值在 2018 年達到 1896 億美元,預計到 2025 年底將達到 3438 億美元。我國國家統計局數據顯示,2017 年,以「互聯網+」為主要形式的文化信息傳輸服務業營業收入 7990 億元,增長 34.6%。

另據我國工信部統計,2017 年我國以 IP 為核心的網絡文學、動漫、影視、遊戲和音樂等泛娛樂產業約為 5484 億元,同比增長 32%,佔數字經濟的比重超過 20%。

互聯網用戶規模特別是移動用戶的快速増長為數字內容產業的發展提供了核心動力,催生了短視頻、AI 直播、VR、AR 等新興業態,以及基於算法推薦的個性化信息服務商業模式。

從用戶規模看,我國網民使用率最高的 TOP10 互聯網應用中,80% 以上的應用與數字內容產業直接相關,平均用戶規模超過 6 億。從具體行業看,網絡視頻、網絡遊戲已成為數字內容產業中的熱點領域;社交媒體繼續保有數字內容產業產值和用戶數量領先的地位;短視頻、網絡直播和垂直知識平臺增長迅猛,投資火熱;數字音樂市場快速增長,全球付費訂閱音樂服務的營收也增長到了 34.98 億美元;虛擬現實和增強現實(VR/AR)技術改變了數字內容產業的產品形態和傳播方式,在新聞、旅遊、娛樂等領域紛紛落地應用。

1 數字內容產業呈現六大發展趨勢

數字內容產業整體發展趨勢體現為縱向延伸、垂直整合、跨界佈局、生態融合,行業邊界逐漸消弭,數字內容產業催生新的社會化分工,孵化出新的產業價值體系,在內容生產、傳播、消費、載體、質量、安全等各環節或方面呈現出六大發展趨勢。


國內首份內容產業智能化報告:AI與5G技術驅動下的內容產業變革


1. 內容生產:「人-機」協同的智能化生產模式將廣泛應用

機器將替代信息挖掘、數據檢索、媒體資源管理等基礎性機械勞動,進一步解放媒體工作者勞動力。

2. 內容傳播:算法精準推薦佔據信息流分發主導地位

算法能夠實現進行數字內容聚合和精準推薦,快速匹配信息與人。比如,智能機器人可以用於跨語言、跨業態的溝通和搜索信息,情感識別技術可幫助改變僵硬固化的標籤設置,使定推更加感性和靈活。

3. 內容消費:沉浸式體驗與交互式反饋提供個性化選擇

可消費的內容形式將拓展至 VR、AR、MR、立體影像、智能音響等搭載智能交互功能後形成的沉浸式體驗產品/服務;數字內容消費反饋的實時性隨之增強,生產者與用戶間信息交互無處不在;用戶將在數字內容消費中扮演更為主動的角色,參與到數字內容的文化創意、內容生產過程中。泛娛樂業與媒體行業勢必會使用更廣泛的人工智能技術以為用戶日益增長的對更佳的沉浸式體驗與交互式反饋的需求提供更多個性化選擇。

4. 內容載體:萬物皆媒環境中數字內容嵌入各類行業場景

新技術普及應用將帶來巨大的數據量和廣泛的連接終端,人工智能保證了海量異構數據的高效和有效轉化。萬物互聯、萬物皆媒的未來,金融、家居、汽車、教育、醫療等各類場景均正在或將成為數字內容新的載體、傳播渠道和信息終端。此外,人工智能在知識產權保護、數字營銷、廣告宣傳等各領域均有應用,極大地拓展了數字內容的外延。

5. 內容質量:「內容為王」成為數字內容產業核心競爭力

用戶面對爆炸式增長的海量信息難免無從甄別,各類軟文廣告、虛假新聞和不良信息不斷侵害用戶的時間線;數字內容的生產者與用戶間的界限日漸模糊為治理帶來更多複雜性和不確定性;基於人工智能的智能生產和精準匹配仍存很大提高空間,多種因素導致當下數字內容質量良莠不齊。

在此背景下,人們的消費數字內容的核心需求將升級為對優質內容的深度體驗,更具創意的成熟內容以及更為合理的商業模式,成為未來數字內容產業的核心競爭力。

6. 內容安全:各類治理難題凸顯,機遇與挑戰長期並存

一方面,固有頑疾與新生挑戰交織,風險複雜泛化,傳統監管模式滯後於產業新業態,各類風險不斷衝擊著現有法律政策體系和公眾道德認知,很大程度制約了數字內容產業的優質發展。

另一方面,風險挑戰本身亦是安全應用的廣闊發展前景,對人工智能技術本身的優化,以及對其在治理各環節應用的積極探索,能夠為治理機制的完善提供技術支撐,保障數字內容產業健康高質量發展。

2 AI 與數字內容交織引發七大風險

人工智能助推數字內容產業顛覆性發展,難免伴隨著現有治理模式及監管體系與新業態的不匹配,既存在現行治理手段滯後帶來的治理失效和力不從心,也體現為數字內容治理問題與其他社會問題及風險的交織泛化,主要風險包含以下七大類:


國內首份內容產業智能化報告:AI與5G技術驅動下的內容產業變革


1. 數字內容極大豐富與內容審核能力不足的矛盾凸顯

面對龐大的數字內容洪流和各國日趨嚴格的內容審核政策,試圖依靠傳統審核模式實現內容含義的準確判斷並及時應對信息爆炸引發的各類問題,越發捉襟見肘。內容審核因工作量繁重,工資偏低,海量負面內容轟炸以及高準確率的內容審核要求,對從業人員產生不小的精神以及身體創傷。儘管機器審核能夠有效緩解人工審核壓力,卻可能存在因算法審核機制不完善而導致的結果歧視。

2.「算法偏見」與「算法黑箱」影響數字內容公正性,技術攻關存難度

算法推薦的歧視結果導致用戶接收不公正、片面加強或偏差的信息。

算法在數字內容產業各環節的普遍應用,不可避免的會遭遇算法黑箱風險:一方面表現為公眾難以或無法理解內容生產、推送和傳播背後的流程邏輯,無從對推薦內容做出反饋和干預,甚至對推薦內容產生反感、質疑情緒;另一方面,受決策不可解釋的侷限,政府部門針對算法輸出的錯誤結果歸因問責困難,從而採取更加嚴苛的數字內容監管措施。

3. 內容造假滋生灰色產業,深度偽造威脅國家社會穩定

以炮製虛假新聞(Fake News)和深度偽造(DeepFakes)為典型風險。政治或經濟利益驅動下的內容造假,大範圍地廣泛傳播或是針對特定人群的精準推送,將惡化數字內容質量,破壞信息傳播秩序,誤導用戶判斷,甚至催生或煽動社會極化情緒, 誘發各種社會問題。

4. 智能化內容生產權責歸屬困難,版權保護亟待健全法規體系政策

人工智能所生產內容的版權問題包括可版權性和版權歸屬兩個問題,其實質是人工智能是否應當以及能夠具備明確的法律主體地位,這是人工智能技術應用對現行法律體系革命性衝擊的又一表現。

5.「信息繭房」循環強化,或引發網絡社群「部落化」、「集群化」

算法主導下的內容分發模式,會放大和加強被標籤了的信息輸出和推送,由此引發「自我封閉」的危險。相同觀念的人們在各類議題熱點下逐漸聚集,對所處社群觀念不斷強化認知,加速網絡社群的「部落化」,甚至最終走向不同社群間觀念極化對立和輿論失衡的極端。

6. 無序數據挖掘洩露個人隱私,躍升數字內容治理突出問題

人工智能應用可採集的信息更加豐富多樣,包括用戶人臉、指紋、聲紋、虹膜、心跳、基因等具有強個人屬性的生物特徵信息。這些信息具有私密性、唯一性和不變性,一旦被洩露或濫用將對公民權益造成嚴重影響。此外,如利用人工智能技術對公開合法手段所收集的非敏感信息進行綜合關聯分析,同樣能夠推測出敏感個人信息的風險,而各種匿名化的技術也增加了個人信息保護的難度。

7. 信息資源競爭或催生新的數字鴻溝,將成數字內容治理新難題

信息社會的競爭目前已逐漸演變為對信息資源的爭奪,誰擁有信息資源,誰才能有效地使用信息資源。人工智能的價值分配會使一部分群體受益,那些擁有信息及強大數據處理能力的企業或個體通過人工智能技術獲得更多信息佔比,從而獲取更多優勢,或可能產生新的數字鴻溝和機會差距。

另外,人工智能時代各國數字內容產業發展的背後,是本國幾乎全部文化信息的「數字化曝光」,傳統時代難以獲取的社會情報將在人工智能時代公開化,數字內容強國的「戰略傳播」將更為便利。

3 AI 時代,各國數字內容治理舉措差異明顯

當前,不同國家的數字內容產業有著不同的發展路徑,所呈現的治理問題在種類、風險和危害程度上亦有差異。在應對人工智能時代新型、複雜的治理挑戰時,現行數字內容治理政策顯得較為滯後和無力,但都結合各國數字內容發展情況作出各有側重的政策創新和嘗試。例如,美國強調對內容造假和算法歧視衝擊國內政治生態的問題治理,歐盟強化算法倫理規範,對數據洩露和歧視言論採取較為嚴格的規制,新加坡和日本除了同樣重視人工智能技術的賦能作用以外,就內容造假和知識產權問題開啟多項立法進程。我國主要通過健全完善數字內容垂直領域的政策規制展開治理,集中關注新聞信息服務、社交群組、泛視頻、直播和電子遊戲。


"


國內首份內容產業智能化報告:AI與5G技術驅動下的內容產業變革

我們理解的數字內容,是所有內容的數字化,包括文本、圖像、音頻、視頻等內容載體形式。5G 的發展會進一步促進內容生產與傳播形式的演變,未來所有智能設備終端都會成為數字內容的信源或推送終端,有屏就有數字內容。

但在數字內容這一新興產業集群的生產鏈條裡,我們需要考察的不僅是業態、生態,更需要結合政策、法律、安全性等多類因素,全方位地去認識技術賦予內容產業全新的發展機遇。

8 月 30 日,在由賽博研究院承辦,騰訊、上海社科院互聯網研究中心等聯合協辦的 2019 世界人工智能安全高端對話上,騰訊安全戰略研究中心聯合賽博研究院重磅發佈《人工智能時代數字內容治理的機遇與挑戰》報告。該報告也是國內首份聚焦人工智能與數字內容行業關係,全景式地呈現了數字內容產業發展趨勢、挑戰風險、政策創新、治理賦能。

蓬勃發展的數字內容產業是前沿數字化信息技術與文化創意內容高度融合的產物,天然兼具科技與文化兩種屬性,是互聯網時代人類文化的主要載體和社交傳播的內核,甚至凝聚各個共同體的理念價值, 將創造新的個體精神世界。

數字內容產品/服務以多種載體形式呈現,基於各類數字化平臺廣泛傳播,並不斷延伸到其他垂直行業,比如涉及到數字出版、數字廣播、數字電視、數字電影、數字音樂、數字動漫、數字遊戲等多個細分行業,也關聯到數字內容產品與服務的生產(UGC、PGC 等)、研發、經營、傳輸、技術支持等產業綜合體的多項複雜環節。

人工智能與數字內容發展相輔相成。人工智能促進了數字內容產業迭代演進,數字內容產業也成為人工智能技術發揮其作用的主要場景之一,甚至成為信息技術研發應用的重要導向。

以數字內容發展為例,基於專家系統(Expert System,ES)的「媒體大腦」等應用,能夠對海量異構數據進行高效的預處理和標準化管理,管理內容資源庫,充分挖掘內容素材和文化創意;自然語言處理(Natural Language Processing,NLP)和計算機視覺 (Computer Vision,CV) 能夠完成對各種形式和場景下數字內容含義的辨識理解,實現內容的精準匹配和個性化定製;機器學習 (Machine Learning,ML) 技術在對內容主體進行要素畫像和標籤設定方面表現突出,使得數字內容突破媒介限制,充分延伸到消費者和其他產業等。

同時,AI、5G、大數據、雲計算、物聯網等各類先進數據智能、網絡基礎設施的新技術交織融合,為數字內容應用與服務提供了創新擴容支持,以全程媒體、全息媒體、全員媒體、全效媒體為代表的全媒體將崛起發展,未來,萬物互聯、萬物皆媒,萬物成為數字內容的載體和出口。

國內首份內容產業智能化報告:AI與5G技術驅動下的內容產業變革

表 1 互聯網時代與人工智能時代數字內容產業比較

美國標普公司的報告顯示,全球數字內容產業的直接總產值在 2018 年達到 1896 億美元,預計到 2025 年底將達到 3438 億美元。我國國家統計局數據顯示,2017 年,以「互聯網+」為主要形式的文化信息傳輸服務業營業收入 7990 億元,增長 34.6%。

另據我國工信部統計,2017 年我國以 IP 為核心的網絡文學、動漫、影視、遊戲和音樂等泛娛樂產業約為 5484 億元,同比增長 32%,佔數字經濟的比重超過 20%。

互聯網用戶規模特別是移動用戶的快速増長為數字內容產業的發展提供了核心動力,催生了短視頻、AI 直播、VR、AR 等新興業態,以及基於算法推薦的個性化信息服務商業模式。

從用戶規模看,我國網民使用率最高的 TOP10 互聯網應用中,80% 以上的應用與數字內容產業直接相關,平均用戶規模超過 6 億。從具體行業看,網絡視頻、網絡遊戲已成為數字內容產業中的熱點領域;社交媒體繼續保有數字內容產業產值和用戶數量領先的地位;短視頻、網絡直播和垂直知識平臺增長迅猛,投資火熱;數字音樂市場快速增長,全球付費訂閱音樂服務的營收也增長到了 34.98 億美元;虛擬現實和增強現實(VR/AR)技術改變了數字內容產業的產品形態和傳播方式,在新聞、旅遊、娛樂等領域紛紛落地應用。

1 數字內容產業呈現六大發展趨勢

數字內容產業整體發展趨勢體現為縱向延伸、垂直整合、跨界佈局、生態融合,行業邊界逐漸消弭,數字內容產業催生新的社會化分工,孵化出新的產業價值體系,在內容生產、傳播、消費、載體、質量、安全等各環節或方面呈現出六大發展趨勢。


國內首份內容產業智能化報告:AI與5G技術驅動下的內容產業變革


1. 內容生產:「人-機」協同的智能化生產模式將廣泛應用

機器將替代信息挖掘、數據檢索、媒體資源管理等基礎性機械勞動,進一步解放媒體工作者勞動力。

2. 內容傳播:算法精準推薦佔據信息流分發主導地位

算法能夠實現進行數字內容聚合和精準推薦,快速匹配信息與人。比如,智能機器人可以用於跨語言、跨業態的溝通和搜索信息,情感識別技術可幫助改變僵硬固化的標籤設置,使定推更加感性和靈活。

3. 內容消費:沉浸式體驗與交互式反饋提供個性化選擇

可消費的內容形式將拓展至 VR、AR、MR、立體影像、智能音響等搭載智能交互功能後形成的沉浸式體驗產品/服務;數字內容消費反饋的實時性隨之增強,生產者與用戶間信息交互無處不在;用戶將在數字內容消費中扮演更為主動的角色,參與到數字內容的文化創意、內容生產過程中。泛娛樂業與媒體行業勢必會使用更廣泛的人工智能技術以為用戶日益增長的對更佳的沉浸式體驗與交互式反饋的需求提供更多個性化選擇。

4. 內容載體:萬物皆媒環境中數字內容嵌入各類行業場景

新技術普及應用將帶來巨大的數據量和廣泛的連接終端,人工智能保證了海量異構數據的高效和有效轉化。萬物互聯、萬物皆媒的未來,金融、家居、汽車、教育、醫療等各類場景均正在或將成為數字內容新的載體、傳播渠道和信息終端。此外,人工智能在知識產權保護、數字營銷、廣告宣傳等各領域均有應用,極大地拓展了數字內容的外延。

5. 內容質量:「內容為王」成為數字內容產業核心競爭力

用戶面對爆炸式增長的海量信息難免無從甄別,各類軟文廣告、虛假新聞和不良信息不斷侵害用戶的時間線;數字內容的生產者與用戶間的界限日漸模糊為治理帶來更多複雜性和不確定性;基於人工智能的智能生產和精準匹配仍存很大提高空間,多種因素導致當下數字內容質量良莠不齊。

在此背景下,人們的消費數字內容的核心需求將升級為對優質內容的深度體驗,更具創意的成熟內容以及更為合理的商業模式,成為未來數字內容產業的核心競爭力。

6. 內容安全:各類治理難題凸顯,機遇與挑戰長期並存

一方面,固有頑疾與新生挑戰交織,風險複雜泛化,傳統監管模式滯後於產業新業態,各類風險不斷衝擊著現有法律政策體系和公眾道德認知,很大程度制約了數字內容產業的優質發展。

另一方面,風險挑戰本身亦是安全應用的廣闊發展前景,對人工智能技術本身的優化,以及對其在治理各環節應用的積極探索,能夠為治理機制的完善提供技術支撐,保障數字內容產業健康高質量發展。

2 AI 與數字內容交織引發七大風險

人工智能助推數字內容產業顛覆性發展,難免伴隨著現有治理模式及監管體系與新業態的不匹配,既存在現行治理手段滯後帶來的治理失效和力不從心,也體現為數字內容治理問題與其他社會問題及風險的交織泛化,主要風險包含以下七大類:


國內首份內容產業智能化報告:AI與5G技術驅動下的內容產業變革


1. 數字內容極大豐富與內容審核能力不足的矛盾凸顯

面對龐大的數字內容洪流和各國日趨嚴格的內容審核政策,試圖依靠傳統審核模式實現內容含義的準確判斷並及時應對信息爆炸引發的各類問題,越發捉襟見肘。內容審核因工作量繁重,工資偏低,海量負面內容轟炸以及高準確率的內容審核要求,對從業人員產生不小的精神以及身體創傷。儘管機器審核能夠有效緩解人工審核壓力,卻可能存在因算法審核機制不完善而導致的結果歧視。

2.「算法偏見」與「算法黑箱」影響數字內容公正性,技術攻關存難度

算法推薦的歧視結果導致用戶接收不公正、片面加強或偏差的信息。

算法在數字內容產業各環節的普遍應用,不可避免的會遭遇算法黑箱風險:一方面表現為公眾難以或無法理解內容生產、推送和傳播背後的流程邏輯,無從對推薦內容做出反饋和干預,甚至對推薦內容產生反感、質疑情緒;另一方面,受決策不可解釋的侷限,政府部門針對算法輸出的錯誤結果歸因問責困難,從而採取更加嚴苛的數字內容監管措施。

3. 內容造假滋生灰色產業,深度偽造威脅國家社會穩定

以炮製虛假新聞(Fake News)和深度偽造(DeepFakes)為典型風險。政治或經濟利益驅動下的內容造假,大範圍地廣泛傳播或是針對特定人群的精準推送,將惡化數字內容質量,破壞信息傳播秩序,誤導用戶判斷,甚至催生或煽動社會極化情緒, 誘發各種社會問題。

4. 智能化內容生產權責歸屬困難,版權保護亟待健全法規體系政策

人工智能所生產內容的版權問題包括可版權性和版權歸屬兩個問題,其實質是人工智能是否應當以及能夠具備明確的法律主體地位,這是人工智能技術應用對現行法律體系革命性衝擊的又一表現。

5.「信息繭房」循環強化,或引發網絡社群「部落化」、「集群化」

算法主導下的內容分發模式,會放大和加強被標籤了的信息輸出和推送,由此引發「自我封閉」的危險。相同觀念的人們在各類議題熱點下逐漸聚集,對所處社群觀念不斷強化認知,加速網絡社群的「部落化」,甚至最終走向不同社群間觀念極化對立和輿論失衡的極端。

6. 無序數據挖掘洩露個人隱私,躍升數字內容治理突出問題

人工智能應用可採集的信息更加豐富多樣,包括用戶人臉、指紋、聲紋、虹膜、心跳、基因等具有強個人屬性的生物特徵信息。這些信息具有私密性、唯一性和不變性,一旦被洩露或濫用將對公民權益造成嚴重影響。此外,如利用人工智能技術對公開合法手段所收集的非敏感信息進行綜合關聯分析,同樣能夠推測出敏感個人信息的風險,而各種匿名化的技術也增加了個人信息保護的難度。

7. 信息資源競爭或催生新的數字鴻溝,將成數字內容治理新難題

信息社會的競爭目前已逐漸演變為對信息資源的爭奪,誰擁有信息資源,誰才能有效地使用信息資源。人工智能的價值分配會使一部分群體受益,那些擁有信息及強大數據處理能力的企業或個體通過人工智能技術獲得更多信息佔比,從而獲取更多優勢,或可能產生新的數字鴻溝和機會差距。

另外,人工智能時代各國數字內容產業發展的背後,是本國幾乎全部文化信息的「數字化曝光」,傳統時代難以獲取的社會情報將在人工智能時代公開化,數字內容強國的「戰略傳播」將更為便利。

3 AI 時代,各國數字內容治理舉措差異明顯

當前,不同國家的數字內容產業有著不同的發展路徑,所呈現的治理問題在種類、風險和危害程度上亦有差異。在應對人工智能時代新型、複雜的治理挑戰時,現行數字內容治理政策顯得較為滯後和無力,但都結合各國數字內容發展情況作出各有側重的政策創新和嘗試。例如,美國強調對內容造假和算法歧視衝擊國內政治生態的問題治理,歐盟強化算法倫理規範,對數據洩露和歧視言論採取較為嚴格的規制,新加坡和日本除了同樣重視人工智能技術的賦能作用以外,就內容造假和知識產權問題開啟多項立法進程。我國主要通過健全完善數字內容垂直領域的政策規制展開治理,集中關注新聞信息服務、社交群組、泛視頻、直播和電子遊戲。


國內首份內容產業智能化報告:AI與5G技術驅動下的內容產業變革


4 AI 在數字內容治理的八大落地場景

報告具體考察了國內外企業運用人工智能技術保障數字內容安全的 20+案例,以治理場景為導向,介紹人工智能技術在內容審核、事實核查、版權保護、打擊詐騙、輿情治理和破除信息繭房等場景領域的技術應用思路和產業探索實踐。

"


國內首份內容產業智能化報告:AI與5G技術驅動下的內容產業變革

我們理解的數字內容,是所有內容的數字化,包括文本、圖像、音頻、視頻等內容載體形式。5G 的發展會進一步促進內容生產與傳播形式的演變,未來所有智能設備終端都會成為數字內容的信源或推送終端,有屏就有數字內容。

但在數字內容這一新興產業集群的生產鏈條裡,我們需要考察的不僅是業態、生態,更需要結合政策、法律、安全性等多類因素,全方位地去認識技術賦予內容產業全新的發展機遇。

8 月 30 日,在由賽博研究院承辦,騰訊、上海社科院互聯網研究中心等聯合協辦的 2019 世界人工智能安全高端對話上,騰訊安全戰略研究中心聯合賽博研究院重磅發佈《人工智能時代數字內容治理的機遇與挑戰》報告。該報告也是國內首份聚焦人工智能與數字內容行業關係,全景式地呈現了數字內容產業發展趨勢、挑戰風險、政策創新、治理賦能。

蓬勃發展的數字內容產業是前沿數字化信息技術與文化創意內容高度融合的產物,天然兼具科技與文化兩種屬性,是互聯網時代人類文化的主要載體和社交傳播的內核,甚至凝聚各個共同體的理念價值, 將創造新的個體精神世界。

數字內容產品/服務以多種載體形式呈現,基於各類數字化平臺廣泛傳播,並不斷延伸到其他垂直行業,比如涉及到數字出版、數字廣播、數字電視、數字電影、數字音樂、數字動漫、數字遊戲等多個細分行業,也關聯到數字內容產品與服務的生產(UGC、PGC 等)、研發、經營、傳輸、技術支持等產業綜合體的多項複雜環節。

人工智能與數字內容發展相輔相成。人工智能促進了數字內容產業迭代演進,數字內容產業也成為人工智能技術發揮其作用的主要場景之一,甚至成為信息技術研發應用的重要導向。

以數字內容發展為例,基於專家系統(Expert System,ES)的「媒體大腦」等應用,能夠對海量異構數據進行高效的預處理和標準化管理,管理內容資源庫,充分挖掘內容素材和文化創意;自然語言處理(Natural Language Processing,NLP)和計算機視覺 (Computer Vision,CV) 能夠完成對各種形式和場景下數字內容含義的辨識理解,實現內容的精準匹配和個性化定製;機器學習 (Machine Learning,ML) 技術在對內容主體進行要素畫像和標籤設定方面表現突出,使得數字內容突破媒介限制,充分延伸到消費者和其他產業等。

同時,AI、5G、大數據、雲計算、物聯網等各類先進數據智能、網絡基礎設施的新技術交織融合,為數字內容應用與服務提供了創新擴容支持,以全程媒體、全息媒體、全員媒體、全效媒體為代表的全媒體將崛起發展,未來,萬物互聯、萬物皆媒,萬物成為數字內容的載體和出口。

國內首份內容產業智能化報告:AI與5G技術驅動下的內容產業變革

表 1 互聯網時代與人工智能時代數字內容產業比較

美國標普公司的報告顯示,全球數字內容產業的直接總產值在 2018 年達到 1896 億美元,預計到 2025 年底將達到 3438 億美元。我國國家統計局數據顯示,2017 年,以「互聯網+」為主要形式的文化信息傳輸服務業營業收入 7990 億元,增長 34.6%。

另據我國工信部統計,2017 年我國以 IP 為核心的網絡文學、動漫、影視、遊戲和音樂等泛娛樂產業約為 5484 億元,同比增長 32%,佔數字經濟的比重超過 20%。

互聯網用戶規模特別是移動用戶的快速増長為數字內容產業的發展提供了核心動力,催生了短視頻、AI 直播、VR、AR 等新興業態,以及基於算法推薦的個性化信息服務商業模式。

從用戶規模看,我國網民使用率最高的 TOP10 互聯網應用中,80% 以上的應用與數字內容產業直接相關,平均用戶規模超過 6 億。從具體行業看,網絡視頻、網絡遊戲已成為數字內容產業中的熱點領域;社交媒體繼續保有數字內容產業產值和用戶數量領先的地位;短視頻、網絡直播和垂直知識平臺增長迅猛,投資火熱;數字音樂市場快速增長,全球付費訂閱音樂服務的營收也增長到了 34.98 億美元;虛擬現實和增強現實(VR/AR)技術改變了數字內容產業的產品形態和傳播方式,在新聞、旅遊、娛樂等領域紛紛落地應用。

1 數字內容產業呈現六大發展趨勢

數字內容產業整體發展趨勢體現為縱向延伸、垂直整合、跨界佈局、生態融合,行業邊界逐漸消弭,數字內容產業催生新的社會化分工,孵化出新的產業價值體系,在內容生產、傳播、消費、載體、質量、安全等各環節或方面呈現出六大發展趨勢。


國內首份內容產業智能化報告:AI與5G技術驅動下的內容產業變革


1. 內容生產:「人-機」協同的智能化生產模式將廣泛應用

機器將替代信息挖掘、數據檢索、媒體資源管理等基礎性機械勞動,進一步解放媒體工作者勞動力。

2. 內容傳播:算法精準推薦佔據信息流分發主導地位

算法能夠實現進行數字內容聚合和精準推薦,快速匹配信息與人。比如,智能機器人可以用於跨語言、跨業態的溝通和搜索信息,情感識別技術可幫助改變僵硬固化的標籤設置,使定推更加感性和靈活。

3. 內容消費:沉浸式體驗與交互式反饋提供個性化選擇

可消費的內容形式將拓展至 VR、AR、MR、立體影像、智能音響等搭載智能交互功能後形成的沉浸式體驗產品/服務;數字內容消費反饋的實時性隨之增強,生產者與用戶間信息交互無處不在;用戶將在數字內容消費中扮演更為主動的角色,參與到數字內容的文化創意、內容生產過程中。泛娛樂業與媒體行業勢必會使用更廣泛的人工智能技術以為用戶日益增長的對更佳的沉浸式體驗與交互式反饋的需求提供更多個性化選擇。

4. 內容載體:萬物皆媒環境中數字內容嵌入各類行業場景

新技術普及應用將帶來巨大的數據量和廣泛的連接終端,人工智能保證了海量異構數據的高效和有效轉化。萬物互聯、萬物皆媒的未來,金融、家居、汽車、教育、醫療等各類場景均正在或將成為數字內容新的載體、傳播渠道和信息終端。此外,人工智能在知識產權保護、數字營銷、廣告宣傳等各領域均有應用,極大地拓展了數字內容的外延。

5. 內容質量:「內容為王」成為數字內容產業核心競爭力

用戶面對爆炸式增長的海量信息難免無從甄別,各類軟文廣告、虛假新聞和不良信息不斷侵害用戶的時間線;數字內容的生產者與用戶間的界限日漸模糊為治理帶來更多複雜性和不確定性;基於人工智能的智能生產和精準匹配仍存很大提高空間,多種因素導致當下數字內容質量良莠不齊。

在此背景下,人們的消費數字內容的核心需求將升級為對優質內容的深度體驗,更具創意的成熟內容以及更為合理的商業模式,成為未來數字內容產業的核心競爭力。

6. 內容安全:各類治理難題凸顯,機遇與挑戰長期並存

一方面,固有頑疾與新生挑戰交織,風險複雜泛化,傳統監管模式滯後於產業新業態,各類風險不斷衝擊著現有法律政策體系和公眾道德認知,很大程度制約了數字內容產業的優質發展。

另一方面,風險挑戰本身亦是安全應用的廣闊發展前景,對人工智能技術本身的優化,以及對其在治理各環節應用的積極探索,能夠為治理機制的完善提供技術支撐,保障數字內容產業健康高質量發展。

2 AI 與數字內容交織引發七大風險

人工智能助推數字內容產業顛覆性發展,難免伴隨著現有治理模式及監管體系與新業態的不匹配,既存在現行治理手段滯後帶來的治理失效和力不從心,也體現為數字內容治理問題與其他社會問題及風險的交織泛化,主要風險包含以下七大類:


國內首份內容產業智能化報告:AI與5G技術驅動下的內容產業變革


1. 數字內容極大豐富與內容審核能力不足的矛盾凸顯

面對龐大的數字內容洪流和各國日趨嚴格的內容審核政策,試圖依靠傳統審核模式實現內容含義的準確判斷並及時應對信息爆炸引發的各類問題,越發捉襟見肘。內容審核因工作量繁重,工資偏低,海量負面內容轟炸以及高準確率的內容審核要求,對從業人員產生不小的精神以及身體創傷。儘管機器審核能夠有效緩解人工審核壓力,卻可能存在因算法審核機制不完善而導致的結果歧視。

2.「算法偏見」與「算法黑箱」影響數字內容公正性,技術攻關存難度

算法推薦的歧視結果導致用戶接收不公正、片面加強或偏差的信息。

算法在數字內容產業各環節的普遍應用,不可避免的會遭遇算法黑箱風險:一方面表現為公眾難以或無法理解內容生產、推送和傳播背後的流程邏輯,無從對推薦內容做出反饋和干預,甚至對推薦內容產生反感、質疑情緒;另一方面,受決策不可解釋的侷限,政府部門針對算法輸出的錯誤結果歸因問責困難,從而採取更加嚴苛的數字內容監管措施。

3. 內容造假滋生灰色產業,深度偽造威脅國家社會穩定

以炮製虛假新聞(Fake News)和深度偽造(DeepFakes)為典型風險。政治或經濟利益驅動下的內容造假,大範圍地廣泛傳播或是針對特定人群的精準推送,將惡化數字內容質量,破壞信息傳播秩序,誤導用戶判斷,甚至催生或煽動社會極化情緒, 誘發各種社會問題。

4. 智能化內容生產權責歸屬困難,版權保護亟待健全法規體系政策

人工智能所生產內容的版權問題包括可版權性和版權歸屬兩個問題,其實質是人工智能是否應當以及能夠具備明確的法律主體地位,這是人工智能技術應用對現行法律體系革命性衝擊的又一表現。

5.「信息繭房」循環強化,或引發網絡社群「部落化」、「集群化」

算法主導下的內容分發模式,會放大和加強被標籤了的信息輸出和推送,由此引發「自我封閉」的危險。相同觀念的人們在各類議題熱點下逐漸聚集,對所處社群觀念不斷強化認知,加速網絡社群的「部落化」,甚至最終走向不同社群間觀念極化對立和輿論失衡的極端。

6. 無序數據挖掘洩露個人隱私,躍升數字內容治理突出問題

人工智能應用可採集的信息更加豐富多樣,包括用戶人臉、指紋、聲紋、虹膜、心跳、基因等具有強個人屬性的生物特徵信息。這些信息具有私密性、唯一性和不變性,一旦被洩露或濫用將對公民權益造成嚴重影響。此外,如利用人工智能技術對公開合法手段所收集的非敏感信息進行綜合關聯分析,同樣能夠推測出敏感個人信息的風險,而各種匿名化的技術也增加了個人信息保護的難度。

7. 信息資源競爭或催生新的數字鴻溝,將成數字內容治理新難題

信息社會的競爭目前已逐漸演變為對信息資源的爭奪,誰擁有信息資源,誰才能有效地使用信息資源。人工智能的價值分配會使一部分群體受益,那些擁有信息及強大數據處理能力的企業或個體通過人工智能技術獲得更多信息佔比,從而獲取更多優勢,或可能產生新的數字鴻溝和機會差距。

另外,人工智能時代各國數字內容產業發展的背後,是本國幾乎全部文化信息的「數字化曝光」,傳統時代難以獲取的社會情報將在人工智能時代公開化,數字內容強國的「戰略傳播」將更為便利。

3 AI 時代,各國數字內容治理舉措差異明顯

當前,不同國家的數字內容產業有著不同的發展路徑,所呈現的治理問題在種類、風險和危害程度上亦有差異。在應對人工智能時代新型、複雜的治理挑戰時,現行數字內容治理政策顯得較為滯後和無力,但都結合各國數字內容發展情況作出各有側重的政策創新和嘗試。例如,美國強調對內容造假和算法歧視衝擊國內政治生態的問題治理,歐盟強化算法倫理規範,對數據洩露和歧視言論採取較為嚴格的規制,新加坡和日本除了同樣重視人工智能技術的賦能作用以外,就內容造假和知識產權問題開啟多項立法進程。我國主要通過健全完善數字內容垂直領域的政策規制展開治理,集中關注新聞信息服務、社交群組、泛視頻、直播和電子遊戲。


國內首份內容產業智能化報告:AI與5G技術驅動下的內容產業變革


4 AI 在數字內容治理的八大落地場景

報告具體考察了國內外企業運用人工智能技術保障數字內容安全的 20+案例,以治理場景為導向,介紹人工智能技術在內容審核、事實核查、版權保護、打擊詐騙、輿情治理和破除信息繭房等場景領域的技術應用思路和產業探索實踐。

國內首份內容產業智能化報告:AI與5G技術驅動下的內容產業變革

如在內容審核方面,人工智能技術極大地提高了不良信息識別發現、審核判別、處置處罰等治理效率,有效節省人力、物力成本。

Facebook 公司開發使用 eGLYPH 工具用於極端主義、歧視言論的內容審核,包括事前審核、事後檢測、刪除和防止洗稿上傳。

而國內對於內容審核的技術應用同樣出眾,如基於騰訊雲圖像分析等人工智能技術,微信推出「珊瑚內容安全助手」小程序,為廣大小程序開發者提供風險自測、內容鑑別、行業動態三個維度的內容安全能力。

事實核查方向,解決三個問題:實時、權威、到人。基於人工智能技術的數據挖掘、文本匯聚、深度學習等技術能夠有效檢索虛假內容的傳播源頭,構建各類結構數據庫和標識體系,幫助核查者對海量資訊進行鍼對性處理,隨著對合成圖片、聲音和視頻的鑑偽技術和溯源技術的研發精進,對虛假信息的識別取得了較大突破。

國內騰訊微信公眾平臺闢謠中心、微信安全中心、騰訊新聞較真平臺、騰訊內容開放平臺企鵝號等探索出一系列有效的事實核查措施,如打造闢謠數據庫,智能識別處置謠言,藉助機器算法觸達謠言易感人群,基於閱讀或投訴謠言的類型標籤進行精準推送闢謠防謠。

法國《世界報》推出了一個名為「Décodex」的事實核查數據庫,幫助讀者識別假冒或不可靠的網站。《世界報》事實核查團隊查證了 600 多個網站,其中包括博客網站、Facebook 網頁、Twitter 賬號等,依據它們的可信度和準確性,對這些網站進行分類。此外,使用《世界報》網站搜索引擎,讀者可通過顏色編碼系統快速判別某網站的可靠性,標記為綠色的網站高度可靠,黃色應謹慎閱讀,紅色意味著該網站虛假信息威脅度極高;諷刺性網站標記為藍色,而一些不能被驗證的網站則被標記為灰色。用戶還可主動標記尚未成為數據庫一部分的其它網站,經後臺系統審核確認後添加近數據庫,《世界報》同時宣佈其數據庫將保持開源,希望接入全球社會全民的事實核查的能力。

破除信息繭房方面,用戶接受信息的總量是有限的,「繭房」邊界可能始終存在,人工智能或許會帶來信息繭房甚至引發輿論失衡和社會極化。但同時,人工智能可以通過算法在「精準化」和「多元化」兩個方向的優化,不斷進化破除信息繭房。

主要在四點做法:

第一,在算法設計中挖掘用戶選擇更深層次因素的分析,需要更精準挖掘。

第二,解決對特定用戶不同維度需求的類別之間的隱性關聯,要加強對它的學習。這點上,機器學習能夠發揮的空間非常大。

第三,在時間線中,按照特定比例推送給用戶不常接觸到的信源或內容,按照比例定推使內容推送多元化,除了它喜歡的以外還要加一些其他的東西平衡。比如,算法優化還可以基於對特定用戶群體提供不同內容推薦模式,比如基於地理位置和行為的分析,識別出青少年或老年人群體,自動切換推薦模式來保障特定「數字弱勢」群體的內容消費安全和質量。

第四,加入自定義修改規則。比如使用 RSS 工具,具有技術素養的人可以通過修改定推的規則來實現平衡自己想去看的內容。

5 AI 時代數字內容治理展望

人工智能是信息時代未來技術發展的主流方向,而數字內容將成為信息時代人類文化的主要形態,兩者的結合是前沿科技與創新文化的深度融合,人工智能在數字內容領域的應用和賦能將成為未來數字經濟時代最重要的特徵之一,數字內容產業也將成為人工智能時代的核心產業之一。

"


國內首份內容產業智能化報告:AI與5G技術驅動下的內容產業變革

我們理解的數字內容,是所有內容的數字化,包括文本、圖像、音頻、視頻等內容載體形式。5G 的發展會進一步促進內容生產與傳播形式的演變,未來所有智能設備終端都會成為數字內容的信源或推送終端,有屏就有數字內容。

但在數字內容這一新興產業集群的生產鏈條裡,我們需要考察的不僅是業態、生態,更需要結合政策、法律、安全性等多類因素,全方位地去認識技術賦予內容產業全新的發展機遇。

8 月 30 日,在由賽博研究院承辦,騰訊、上海社科院互聯網研究中心等聯合協辦的 2019 世界人工智能安全高端對話上,騰訊安全戰略研究中心聯合賽博研究院重磅發佈《人工智能時代數字內容治理的機遇與挑戰》報告。該報告也是國內首份聚焦人工智能與數字內容行業關係,全景式地呈現了數字內容產業發展趨勢、挑戰風險、政策創新、治理賦能。

蓬勃發展的數字內容產業是前沿數字化信息技術與文化創意內容高度融合的產物,天然兼具科技與文化兩種屬性,是互聯網時代人類文化的主要載體和社交傳播的內核,甚至凝聚各個共同體的理念價值, 將創造新的個體精神世界。

數字內容產品/服務以多種載體形式呈現,基於各類數字化平臺廣泛傳播,並不斷延伸到其他垂直行業,比如涉及到數字出版、數字廣播、數字電視、數字電影、數字音樂、數字動漫、數字遊戲等多個細分行業,也關聯到數字內容產品與服務的生產(UGC、PGC 等)、研發、經營、傳輸、技術支持等產業綜合體的多項複雜環節。

人工智能與數字內容發展相輔相成。人工智能促進了數字內容產業迭代演進,數字內容產業也成為人工智能技術發揮其作用的主要場景之一,甚至成為信息技術研發應用的重要導向。

以數字內容發展為例,基於專家系統(Expert System,ES)的「媒體大腦」等應用,能夠對海量異構數據進行高效的預處理和標準化管理,管理內容資源庫,充分挖掘內容素材和文化創意;自然語言處理(Natural Language Processing,NLP)和計算機視覺 (Computer Vision,CV) 能夠完成對各種形式和場景下數字內容含義的辨識理解,實現內容的精準匹配和個性化定製;機器學習 (Machine Learning,ML) 技術在對內容主體進行要素畫像和標籤設定方面表現突出,使得數字內容突破媒介限制,充分延伸到消費者和其他產業等。

同時,AI、5G、大數據、雲計算、物聯網等各類先進數據智能、網絡基礎設施的新技術交織融合,為數字內容應用與服務提供了創新擴容支持,以全程媒體、全息媒體、全員媒體、全效媒體為代表的全媒體將崛起發展,未來,萬物互聯、萬物皆媒,萬物成為數字內容的載體和出口。

國內首份內容產業智能化報告:AI與5G技術驅動下的內容產業變革

表 1 互聯網時代與人工智能時代數字內容產業比較

美國標普公司的報告顯示,全球數字內容產業的直接總產值在 2018 年達到 1896 億美元,預計到 2025 年底將達到 3438 億美元。我國國家統計局數據顯示,2017 年,以「互聯網+」為主要形式的文化信息傳輸服務業營業收入 7990 億元,增長 34.6%。

另據我國工信部統計,2017 年我國以 IP 為核心的網絡文學、動漫、影視、遊戲和音樂等泛娛樂產業約為 5484 億元,同比增長 32%,佔數字經濟的比重超過 20%。

互聯網用戶規模特別是移動用戶的快速増長為數字內容產業的發展提供了核心動力,催生了短視頻、AI 直播、VR、AR 等新興業態,以及基於算法推薦的個性化信息服務商業模式。

從用戶規模看,我國網民使用率最高的 TOP10 互聯網應用中,80% 以上的應用與數字內容產業直接相關,平均用戶規模超過 6 億。從具體行業看,網絡視頻、網絡遊戲已成為數字內容產業中的熱點領域;社交媒體繼續保有數字內容產業產值和用戶數量領先的地位;短視頻、網絡直播和垂直知識平臺增長迅猛,投資火熱;數字音樂市場快速增長,全球付費訂閱音樂服務的營收也增長到了 34.98 億美元;虛擬現實和增強現實(VR/AR)技術改變了數字內容產業的產品形態和傳播方式,在新聞、旅遊、娛樂等領域紛紛落地應用。

1 數字內容產業呈現六大發展趨勢

數字內容產業整體發展趨勢體現為縱向延伸、垂直整合、跨界佈局、生態融合,行業邊界逐漸消弭,數字內容產業催生新的社會化分工,孵化出新的產業價值體系,在內容生產、傳播、消費、載體、質量、安全等各環節或方面呈現出六大發展趨勢。


國內首份內容產業智能化報告:AI與5G技術驅動下的內容產業變革


1. 內容生產:「人-機」協同的智能化生產模式將廣泛應用

機器將替代信息挖掘、數據檢索、媒體資源管理等基礎性機械勞動,進一步解放媒體工作者勞動力。

2. 內容傳播:算法精準推薦佔據信息流分發主導地位

算法能夠實現進行數字內容聚合和精準推薦,快速匹配信息與人。比如,智能機器人可以用於跨語言、跨業態的溝通和搜索信息,情感識別技術可幫助改變僵硬固化的標籤設置,使定推更加感性和靈活。

3. 內容消費:沉浸式體驗與交互式反饋提供個性化選擇

可消費的內容形式將拓展至 VR、AR、MR、立體影像、智能音響等搭載智能交互功能後形成的沉浸式體驗產品/服務;數字內容消費反饋的實時性隨之增強,生產者與用戶間信息交互無處不在;用戶將在數字內容消費中扮演更為主動的角色,參與到數字內容的文化創意、內容生產過程中。泛娛樂業與媒體行業勢必會使用更廣泛的人工智能技術以為用戶日益增長的對更佳的沉浸式體驗與交互式反饋的需求提供更多個性化選擇。

4. 內容載體:萬物皆媒環境中數字內容嵌入各類行業場景

新技術普及應用將帶來巨大的數據量和廣泛的連接終端,人工智能保證了海量異構數據的高效和有效轉化。萬物互聯、萬物皆媒的未來,金融、家居、汽車、教育、醫療等各類場景均正在或將成為數字內容新的載體、傳播渠道和信息終端。此外,人工智能在知識產權保護、數字營銷、廣告宣傳等各領域均有應用,極大地拓展了數字內容的外延。

5. 內容質量:「內容為王」成為數字內容產業核心競爭力

用戶面對爆炸式增長的海量信息難免無從甄別,各類軟文廣告、虛假新聞和不良信息不斷侵害用戶的時間線;數字內容的生產者與用戶間的界限日漸模糊為治理帶來更多複雜性和不確定性;基於人工智能的智能生產和精準匹配仍存很大提高空間,多種因素導致當下數字內容質量良莠不齊。

在此背景下,人們的消費數字內容的核心需求將升級為對優質內容的深度體驗,更具創意的成熟內容以及更為合理的商業模式,成為未來數字內容產業的核心競爭力。

6. 內容安全:各類治理難題凸顯,機遇與挑戰長期並存

一方面,固有頑疾與新生挑戰交織,風險複雜泛化,傳統監管模式滯後於產業新業態,各類風險不斷衝擊著現有法律政策體系和公眾道德認知,很大程度制約了數字內容產業的優質發展。

另一方面,風險挑戰本身亦是安全應用的廣闊發展前景,對人工智能技術本身的優化,以及對其在治理各環節應用的積極探索,能夠為治理機制的完善提供技術支撐,保障數字內容產業健康高質量發展。

2 AI 與數字內容交織引發七大風險

人工智能助推數字內容產業顛覆性發展,難免伴隨著現有治理模式及監管體系與新業態的不匹配,既存在現行治理手段滯後帶來的治理失效和力不從心,也體現為數字內容治理問題與其他社會問題及風險的交織泛化,主要風險包含以下七大類:


國內首份內容產業智能化報告:AI與5G技術驅動下的內容產業變革


1. 數字內容極大豐富與內容審核能力不足的矛盾凸顯

面對龐大的數字內容洪流和各國日趨嚴格的內容審核政策,試圖依靠傳統審核模式實現內容含義的準確判斷並及時應對信息爆炸引發的各類問題,越發捉襟見肘。內容審核因工作量繁重,工資偏低,海量負面內容轟炸以及高準確率的內容審核要求,對從業人員產生不小的精神以及身體創傷。儘管機器審核能夠有效緩解人工審核壓力,卻可能存在因算法審核機制不完善而導致的結果歧視。

2.「算法偏見」與「算法黑箱」影響數字內容公正性,技術攻關存難度

算法推薦的歧視結果導致用戶接收不公正、片面加強或偏差的信息。

算法在數字內容產業各環節的普遍應用,不可避免的會遭遇算法黑箱風險:一方面表現為公眾難以或無法理解內容生產、推送和傳播背後的流程邏輯,無從對推薦內容做出反饋和干預,甚至對推薦內容產生反感、質疑情緒;另一方面,受決策不可解釋的侷限,政府部門針對算法輸出的錯誤結果歸因問責困難,從而採取更加嚴苛的數字內容監管措施。

3. 內容造假滋生灰色產業,深度偽造威脅國家社會穩定

以炮製虛假新聞(Fake News)和深度偽造(DeepFakes)為典型風險。政治或經濟利益驅動下的內容造假,大範圍地廣泛傳播或是針對特定人群的精準推送,將惡化數字內容質量,破壞信息傳播秩序,誤導用戶判斷,甚至催生或煽動社會極化情緒, 誘發各種社會問題。

4. 智能化內容生產權責歸屬困難,版權保護亟待健全法規體系政策

人工智能所生產內容的版權問題包括可版權性和版權歸屬兩個問題,其實質是人工智能是否應當以及能夠具備明確的法律主體地位,這是人工智能技術應用對現行法律體系革命性衝擊的又一表現。

5.「信息繭房」循環強化,或引發網絡社群「部落化」、「集群化」

算法主導下的內容分發模式,會放大和加強被標籤了的信息輸出和推送,由此引發「自我封閉」的危險。相同觀念的人們在各類議題熱點下逐漸聚集,對所處社群觀念不斷強化認知,加速網絡社群的「部落化」,甚至最終走向不同社群間觀念極化對立和輿論失衡的極端。

6. 無序數據挖掘洩露個人隱私,躍升數字內容治理突出問題

人工智能應用可採集的信息更加豐富多樣,包括用戶人臉、指紋、聲紋、虹膜、心跳、基因等具有強個人屬性的生物特徵信息。這些信息具有私密性、唯一性和不變性,一旦被洩露或濫用將對公民權益造成嚴重影響。此外,如利用人工智能技術對公開合法手段所收集的非敏感信息進行綜合關聯分析,同樣能夠推測出敏感個人信息的風險,而各種匿名化的技術也增加了個人信息保護的難度。

7. 信息資源競爭或催生新的數字鴻溝,將成數字內容治理新難題

信息社會的競爭目前已逐漸演變為對信息資源的爭奪,誰擁有信息資源,誰才能有效地使用信息資源。人工智能的價值分配會使一部分群體受益,那些擁有信息及強大數據處理能力的企業或個體通過人工智能技術獲得更多信息佔比,從而獲取更多優勢,或可能產生新的數字鴻溝和機會差距。

另外,人工智能時代各國數字內容產業發展的背後,是本國幾乎全部文化信息的「數字化曝光」,傳統時代難以獲取的社會情報將在人工智能時代公開化,數字內容強國的「戰略傳播」將更為便利。

3 AI 時代,各國數字內容治理舉措差異明顯

當前,不同國家的數字內容產業有著不同的發展路徑,所呈現的治理問題在種類、風險和危害程度上亦有差異。在應對人工智能時代新型、複雜的治理挑戰時,現行數字內容治理政策顯得較為滯後和無力,但都結合各國數字內容發展情況作出各有側重的政策創新和嘗試。例如,美國強調對內容造假和算法歧視衝擊國內政治生態的問題治理,歐盟強化算法倫理規範,對數據洩露和歧視言論採取較為嚴格的規制,新加坡和日本除了同樣重視人工智能技術的賦能作用以外,就內容造假和知識產權問題開啟多項立法進程。我國主要通過健全完善數字內容垂直領域的政策規制展開治理,集中關注新聞信息服務、社交群組、泛視頻、直播和電子遊戲。


國內首份內容產業智能化報告:AI與5G技術驅動下的內容產業變革


4 AI 在數字內容治理的八大落地場景

報告具體考察了國內外企業運用人工智能技術保障數字內容安全的 20+案例,以治理場景為導向,介紹人工智能技術在內容審核、事實核查、版權保護、打擊詐騙、輿情治理和破除信息繭房等場景領域的技術應用思路和產業探索實踐。

國內首份內容產業智能化報告:AI與5G技術驅動下的內容產業變革

如在內容審核方面,人工智能技術極大地提高了不良信息識別發現、審核判別、處置處罰等治理效率,有效節省人力、物力成本。

Facebook 公司開發使用 eGLYPH 工具用於極端主義、歧視言論的內容審核,包括事前審核、事後檢測、刪除和防止洗稿上傳。

而國內對於內容審核的技術應用同樣出眾,如基於騰訊雲圖像分析等人工智能技術,微信推出「珊瑚內容安全助手」小程序,為廣大小程序開發者提供風險自測、內容鑑別、行業動態三個維度的內容安全能力。

事實核查方向,解決三個問題:實時、權威、到人。基於人工智能技術的數據挖掘、文本匯聚、深度學習等技術能夠有效檢索虛假內容的傳播源頭,構建各類結構數據庫和標識體系,幫助核查者對海量資訊進行鍼對性處理,隨著對合成圖片、聲音和視頻的鑑偽技術和溯源技術的研發精進,對虛假信息的識別取得了較大突破。

國內騰訊微信公眾平臺闢謠中心、微信安全中心、騰訊新聞較真平臺、騰訊內容開放平臺企鵝號等探索出一系列有效的事實核查措施,如打造闢謠數據庫,智能識別處置謠言,藉助機器算法觸達謠言易感人群,基於閱讀或投訴謠言的類型標籤進行精準推送闢謠防謠。

法國《世界報》推出了一個名為「Décodex」的事實核查數據庫,幫助讀者識別假冒或不可靠的網站。《世界報》事實核查團隊查證了 600 多個網站,其中包括博客網站、Facebook 網頁、Twitter 賬號等,依據它們的可信度和準確性,對這些網站進行分類。此外,使用《世界報》網站搜索引擎,讀者可通過顏色編碼系統快速判別某網站的可靠性,標記為綠色的網站高度可靠,黃色應謹慎閱讀,紅色意味著該網站虛假信息威脅度極高;諷刺性網站標記為藍色,而一些不能被驗證的網站則被標記為灰色。用戶還可主動標記尚未成為數據庫一部分的其它網站,經後臺系統審核確認後添加近數據庫,《世界報》同時宣佈其數據庫將保持開源,希望接入全球社會全民的事實核查的能力。

破除信息繭房方面,用戶接受信息的總量是有限的,「繭房」邊界可能始終存在,人工智能或許會帶來信息繭房甚至引發輿論失衡和社會極化。但同時,人工智能可以通過算法在「精準化」和「多元化」兩個方向的優化,不斷進化破除信息繭房。

主要在四點做法:

第一,在算法設計中挖掘用戶選擇更深層次因素的分析,需要更精準挖掘。

第二,解決對特定用戶不同維度需求的類別之間的隱性關聯,要加強對它的學習。這點上,機器學習能夠發揮的空間非常大。

第三,在時間線中,按照特定比例推送給用戶不常接觸到的信源或內容,按照比例定推使內容推送多元化,除了它喜歡的以外還要加一些其他的東西平衡。比如,算法優化還可以基於對特定用戶群體提供不同內容推薦模式,比如基於地理位置和行為的分析,識別出青少年或老年人群體,自動切換推薦模式來保障特定「數字弱勢」群體的內容消費安全和質量。

第四,加入自定義修改規則。比如使用 RSS 工具,具有技術素養的人可以通過修改定推的規則來實現平衡自己想去看的內容。

5 AI 時代數字內容治理展望

人工智能是信息時代未來技術發展的主流方向,而數字內容將成為信息時代人類文化的主要形態,兩者的結合是前沿科技與創新文化的深度融合,人工智能在數字內容領域的應用和賦能將成為未來數字經濟時代最重要的特徵之一,數字內容產業也將成為人工智能時代的核心產業之一。

國內首份內容產業智能化報告:AI與5G技術驅動下的內容產業變革


"

相關推薦

推薦中...