個性化信息流做錯了什麼?

個性化信息流可以個性化地給用戶推薦他們想看的內容,其中包含了興趣訂閱、系統推送、好友動態,商業廣告等等,達到千人千面的效果。

個性化信息流做錯了什麼?

2019年4月11日,新浪微博更新其Android客戶端,新增完全按關注與時間進行排序的“最新微博”功能,引起了一波小小的矚目。這事實上並非是一個全新的功能,而是找回了微博最初的信息排布方式。

個性化信息流做錯了什麼?

微博公佈更新後,迅速引發好評

無獨有偶,Facebook也在今年4月1日公開了兩項關於信息流的新舉措,其一是“為什麼我會看到這個”功能,是2014年“為什麼我看到這個廣告?”的延伸。這一功能試圖向用戶解釋在個性化信息流中為何會在此時展示這條信息。

另一舉措是Facebook計劃將嚴肅新聞與社交內容拆分,對嚴肅新聞報道向傳統媒體學習採用更多的人工編輯進行干預,用於減少假新聞與謠言對用戶及平臺的傷害。

與十年前“個性化信息流就是絕對正確”的趨勢相比,個性化信息流似乎突然“失寵”了。在這十年中,發生了什麼?個性化信息流變得一無是處了嗎?

也許並沒有,只是用戶和平臺都更能客觀地認識到個性化信息流帶來的益處與害處。

一、什麼是信息流?

信息流一般指一個聚合了無數個動態的頁面,因此信息流類產品普遍又叫NewsAggrerator(信息聚合器)。信息流並非都是以個性化算法驅動的,恰恰相反最早的信息流以RSS協議驅動,往往嚴格採用“關注-時間”兩個要素進行排序。即只有用戶主動關注的主體發佈的動態會出現,所有動態嚴格依照發布時間排序。只是在個性化算法引入之前,信息流的概念在國內並不流行。

國內流行的信息流,一般指個性化信息流,它通過個性化算法驅動,“關注”與“時間”兩個要素降級為個性化算法中的兩個參數受權重影響。即便是用戶沒有關注的或者是較早發佈的內容,只要算法判斷用戶可能對該內容感興趣,便也可能出現在信息流裡。

個性化信息流可以個性化的給用戶推薦他們想看的內容,做到千人千面。這些信息的來源包含興趣訂閱、系統推送、好友動態,商業廣告……它們共同聚合而成了今天絕大部分產品裡的信息流頁面。

與完全採用“關注-時間”排序的時間流相比,個性化信息流有兩個較為顯著的差別:

1. 時間流受到用戶關注範圍的限制,單位時間內可供閱讀的內容有限,個性化信息流往往是無限的;

2. 用戶對時間流內出現的信息往往有較強的控制能力,可以通過關注、取消關注或設置關鍵詞抓取、關鍵詞屏蔽增減某一類信息。

這兩種差別帶來的用戶體驗有好有壞,無限的內容意味著用戶可以在一定的時間內充分閱讀,但同時也會佔用用戶更多的時間;由算法篩選信息代替用戶手動篩選,降低了普通用戶在使用內容產品時的門檻,避免了用戶“不知道去哪找信息”、“不知道該看什麼”的問題,但也助長了信息繭房、謠言與標題黨問題。

從Facebook,到微博微信,再到個性化新聞客戶端,越來越多的信息流產品和廣告用數據證明了其強大的威力,它改變了新聞的分發模式,也為社交媒體開創了全新盈利的模式,甚至培養了用戶的在線新聞消費習慣。

二、信息流簡史

與許多人印象中的不同,最初的社交媒體並非以信息流排布,無論是時間順序還是個性化順序都不是。比如在Facebook之前的流行的另一美國社交網站MySpace上,用戶面對的不是一個排布著好友最新動態的頁面,而是自己的個人主頁。

個性化信息流做錯了什麼?

早期的MySpace界面

用戶想要看到好友內容得去列表裡搜索,進而查看他們的動態與留言。這在內容的分發、實時性和互動關係上,都是一種低效率的產品形態。

改變這一現象的是信息流的鼻祖Facebook,在其問世兩年後的2004年推出了NewsFeed,這款產品第一次將用戶好友不斷更新的信息整合到用戶可見的一個單一頁面上,形成了信息流的雛形。

2009年,Facebook加上了贊(like)功能,開始按照熱門程度而不僅僅是時間線對Feed進行排序,當整個頁面在好友量達到一定程度且足夠活躍時,就會具有很強的實時感。

與之前的社交平臺對比,Newsfeed在實時、分發和交互等特性上取得了完勝。有無信息流首頁可以對一個關係鏈模式類似的產品造成巨大的差別。

隨著社交媒體的發展,信息流也在不斷優化改變,Facebook的EdgeRank算法的推出以“個性化”取代“時間順序”的一個里程碑事件。

EdgeRank算法就像是Google的PageRank算法一樣,決定了用戶在自己的頁面裡能夠看到什麼。這最初的目的可能是被用於應對移動互聯網崛起帶來的信息爆炸——

每個人在社交網站上都有太多的好友,每個好友都發了太多的信息,而用戶卻不一定有時間看完所有的信息,與其讓最新的但用戶可能不關心的信息淹沒了那些更有價值的內容,不如通過算法來調整一下信息的排布順序。

諷刺的是,按現在我們已知的結果,個性化信息流事實上與“節省用戶時間,將注意力放在更有質量的內容”這一初衷幾乎相反。

2010年左右第一版EdgeRank算法問世。EdgeRank主要有三個因素在起作用:

  1. 親密度:量化考慮平常裡你和這個朋友“走動”是否頻繁,連接是否緊密。是點贊之交,還是評論之交,或是私信之交。
  2. 邊的權重:點贊、評論、發一條文字、發一張照片、發一個鏈接,背後用戶付出的成本不一樣,反應在邊的權重上也就不一樣,成本越高的,權重越大。
  3. 新鮮程度:新的新鮮事總體上更可能得到用戶的喜愛,Facebook用了一個與時間相關的指數衰減函數來量化動態的新舊程度。

值得注意的是,此時的EdgeRank基本上只考慮了社交方面的因素,而沒有考慮太多內容本身對用戶吸引力,也就是說EdgeRank並不是個性化算法,只是打破了信息一定與時間相關的這一慣性思路。這在以關係為主的社交網絡中比較有效,但不太適合Twitter、微博和後來的個性化新聞客戶端這種媒體屬性較強的網絡。

2011年之後,Facebook不再提起EdgeRank算法,進入到了後EdgeRank時代。同年Twitter在其信息流中插入商業化內容,正式推出了信息流廣告產品。2012年新浪微博推出信息流商業化產品,將信息流廣告引進國內。

2013年Facebook對信息流的可視內容進行加強,開始依照每一項信息的內容本身進行權重排序。同時,無論任何的故事,照片、事件、動態,都會以圖片為主題在NewsFeed裡進行顯示,文字的主體性被大大削弱。

充分利用圖片與視覺內容的同時,Facebook還試圖把朋友的分享和公共分享區分開,不僅讓大家只看到熱門文章,還能看到和自己更相關的朋友和家人的分享。目的是讓新版NewsFeed能給用戶帶來“個性化報紙”的體驗。

2015年,新浪微博開始灰度測試“智能排序”,打破“按關注帳號發佈內容的時間順序排序”,這一功能在日後成為新浪微博的唯一設置。雖然智能排序上線後,新浪微博的用戶活躍、用戶總量、使用時長等數據均有較大幅度上升。

但在民間更願意用“亂序時間流”這個極具反差的名字來稱呼這一模式,對於使用微博記錄生活和最新資訊(時間強相關)的用戶來說,這種個性化信息流有不少值得吐槽的尷尬,比如在首頁看到三天前的八卦、在早上看到晚安……

個性化信息流做錯了什麼?

網友曾吐槽百度,認為搜索引擎無需增加信息流功能,但在百度上線信息流一年後Google也上線了信息流

次年,UC瀏覽器、百度搜索引擎等App也紛紛上線了信息流,信息流市場的競爭格局正式形成。

到了2017年,國內外的信息流產品已經是紅海一片。基於社交關係嘗試輕推薦的微信看一看功能上線,讓微信可消費的內容又多了一個維度。老牌搜索引擎Google也上線了GoogleFeed。

谷歌,百度、騰訊不約而同紛紛加碼信息流產品,近兩年更是形成了“有流量就有信息流”的蓬勃姿態,逐漸從傳統的人找信息演進到信息找人。

然後,來到了故事的開始,那些最早啟用性化信息流的平臺,如今又開始了去個性化之路。

三、個性化信息流的愛與恨

為什麼“喜愛”個性化信息流?

如果用一句話來說明,為何各大互聯網公司都跟進了信息流,並且最終都導向與時間無強相關的個性化信息流。那麼理由一定是:信息流,確實好用。

這裡的好用分為兩個方面,對用戶和互聯網平臺個性化信息流都有好處。一方面對用戶來說,儘管有一些爭議,但用戶行為數據(活躍度、用戶粘性、用戶時長)指出,大多數用戶喜愛個性化信息流超於時間順序信息流;另一方面,由於得到了用戶的喜愛,信息流往往有著更好的商業價值。

(1)對用戶:更好的用戶體驗

信息流“信息找人”的整體思路,革新了自搜索引擎誕生以來的信息檢索模式,是更適合互聯網的信息傳播方式。

在過去,一個不知道某個信息的人,如何找到某個信息其實在一定程度上是一個悖論。即假設一個人不知道某項知識,那麼它在圖書館裡也不可能讀到這項知識,因為圖書館裡的書太多,這個人不會注意到相對應的書籍。

信息流前的互聯網,與無網時代的信息組織形式相似,需要由專業的編輯對信息進行篩選、推薦,搜索引擎等信息檢索服務則需要用戶自身給出問題才能進行反饋。

而信息流的出現,更符合信息從“傳者中心”到“受者中心”的現代傳受關係轉移的趨勢,這種趨勢無疑是給予用戶更好的信息接收體驗:

媒體細分化發展的規律,更好地滿足了用戶的差異化信息需求,生成個性化的推薦列表。千人千面的形式非常符合現今人們獲取信息的途徑。

同時不斷優化的推薦算法也在逐漸迎合用戶的心理,例如強調社交關係交互的Facebook,通過從大量的信息中有效地過濾掉用戶不關心的內容,讓用戶可以不錯過自己關心和聯繫緊密的新鮮事。對大部分用戶來說是在提高單位時間的信息價值,減少噪聲的干擾。

(2)對企業:強大的商業潛能

從Facebook、微博、新聞客戶端等產品對個性化算法的表述來看,用戶確實更喜歡信息流。因為當信息流出現在產品中後,用戶的使用時間更長,頻率更高。搜索是一種有限的業務,它的邊界受制於用戶初始的認知邊界,但信息流是無限的。

對於商業公司來說,更長的用戶時間和更多樣的內容呈現,顯然更利於以廣告位驅動的商業模式。穩定的用戶粘性給信息流帶了了商業潛能,通過信息流提升用戶使用時長,也就產生了更多的廣告變現機會。

同時信息流的個性化分發方式給了廣告主精準定位的可能性,提升了變現的機率。對於廣告主而言,信息流整合了傳統與新媒體的優勢,主動向潛在用戶提供易於接受營銷信息,形成了全新的營銷藍海市場。

為什麼“討厭”信息流?

既然信息流在表面上看是平臺與用戶雙贏的,那麼為何在經歷了僅10年的發展後,各大平臺卻主動對信息流模式進行了反向調整,弱化信息流在產品中的地位呢?因為信息流帶來的好處並非完全沒有代價,一味的將整個產品押注信息流,對用戶和平臺自身都有一定傷害。

(1)增強平臺媒體屬性

與搜索算法不同,信息流算法尤其是個性化信息流算法與這個更為難以解釋的內部運作機制。最終的產品呈現可能與開發者和用戶所最初期待的並不一致,而對於一款媒體屬性較強的產品來說這並不一定是件好事。

在美國,信息流遭遇的“假新聞”、“影響大選”等質疑,便是這一問題的集中體現。

社交平臺在發展過程始終存在著與媒體的博弈。美國心理學家羅伯特·愛潑斯坦研究發現,在美國大選期間,谷歌總是顯示有利於希拉里·克林頓的正面搜索關鍵詞建議,而對特朗普則總是顯示負面搜索關鍵詞建議,同時會屏蔽對希拉里的負面搜索關鍵詞建議。

Facebook也曾遭遇過類似的指責,然而這並不一定是Google或Facebook公司的本意,因為按照這些科技公司的解釋,他們的算法在很大程度上是“自動運轉”的。

大眾媒體有四項功能,傳播信息,引導輿論,教育大眾和提供娛樂。社交平臺的媒體屬性讓它們逐漸增強了輿論引導的趨勢。今年5月的一期《經濟學人》雜誌甚至指出:facebook不再僅僅是一個虛擬社交的目的地,而是一家可以影響或塑造公眾態度的媒體機構。

信息流可以讓用戶直接從朋友或某些源頭更快地獲取消息,但在引入個性化算法和針對不同內容的權重之後便不再只是如此。算法像是一個黑箱,它作為一種新型的內容推薦方式,讓社交平臺的媒體屬性增強,左右用戶能看到和不能看到的新聞與信息,進而影響到用戶的情緒,而更令人不安的是它究竟在往哪個方向影響是連其研發者也不能完全掌握的。

(2)信息繭房-比想象的更嚴重

面對初次接觸的用戶,機器算法主導的精準分發可以提升閱讀體驗,但隨著使用時間的延長,也極易導致由信息收窄帶來的一葉障目。信息繭房往往被用於形容那些只使用個性化信息流產品的用戶,由於算法只會向他們推薦他們感興趣的內容,長期來看此類用戶的閱讀邊界必然會收到限制。

但事實上,這不僅降低了用戶在一個產品中的使用體驗,同時還讓所有的信息流產品變得“千篇一律”,因為用戶無論進入哪個產品看到的都是自己喜歡的話題與自己感興趣的形式。這與個性化信息流剛剛出現時所代表的“千人千面”正好相反,讓同一個用戶面對不同產品時“共享疲倦感”,消解了互聯網產品之間差異化競爭的意義。

因此,信息繭房並非對長期用戶體驗有所傷害,僅以平臺商業利益來講也絕非好事。

(3)多數人的“暴政”,治理難度增大

對“低俗”的追求,往往與人類共同的原始慾望相關,現代文明社會的規則讓人們懂得只在私人空間中表達自己的需求。

但遺憾的是,算法並不能理解這一點。

不排除許多用戶在某些情境下,對“低俗”內容有一定需求。但沒有人一直對“低俗”內容有需求,也不意味著所有人都對低俗內容有需求。

“低俗”的信息會刺激人性中的陰暗面,吸引點擊量。當大多數人都會在一些情境下忍不住點擊低俗內容時,創作低俗內容就會帶來更多的流量與關注。在沒有人工把控的情況下,算法只會放大這個反饋循環而不會加以限制。

不知不覺用戶的信息流上便充斥了打著擦邊球的內容。

信息流平臺並不總是像公眾質疑的那樣有意縱容低俗內容,因為一個充斥低俗內容的信息流會顯著窄化其目標用戶,將女性、未成年人、老人、格調較高者拒之門外。

但除非直接引入人工干預,否則算法自身似乎很難理解究竟什麼是低俗,因為低俗是一個道德與品味相關的概念,在不同國家與地區、不同受教育階層、不同的社會階層、不同文化語境甚至不同時間段裡有著完全不同的釋義。

讓算法理解低俗的難度不亞於讓算法理解人類道德,往往流於某些剛性而簡單的判斷標準,比如赤裸暴露、髒話等。而對於那些並非直接色情或直接暴力語言的內容,比如帶有映射的黃段子、並不暴露帶有性暗示意味的圖片和視頻,算法卻很難識別到,而後者才是低俗中的“主力軍”。

(4)隱私洩露

用戶隱私保護是互聯網中長期存在的問題,推薦算法需要用戶的歷史行為信息,或者用戶的人口統計屬性信息,不能很好保護用戶隱私的產品和平臺會讓用戶沒有安全感,Facebook的隱私事件就是很好的例證。但矛盾點是當算法擁有足夠多的隱私和信息時,才能夠更為精準地投放。

另一方面,當社交屬性與推薦流結合起來,很多人也會認為這種曝光影響了自己的社交自由程度。一些雜糅的功能雖然是主動性的選擇,但卻提高了社交壓力,更多地暴露了隱私,使原本是匿名的行為成了能被查看的輕度推薦。

四、未來的思路:讓個性化恰如其分

從簡單的時間順序到需要考慮上千個潛在元素,不斷完善的信息流成就了更加個性化的互聯網社區。但這個被稱為Facebook10年間最成功的賭注,依然需要在利弊權衡中摸索前行的方向,尋找到矛盾點中的平衡。在當下看來,最好的做法似乎是在算法與人類(用戶與編輯)主動權之間做好平衡——即並非否定個性化信息流,而是隻在恰當的情境下使用個性化算法。

基於算法推薦的Feed流一定程度上把主動權交給了機器,在不改變以個性化信息為主導或唯一產品形態的前提下,用戶、信息生產者乃至平臺管理者自身都處於被動地位。當信息繭化、信息無序化紛紛出現,用戶的選擇權和體驗感被削弱等長期負面效應漸漸顯露之後,許多平臺選擇改變個性化算法在產品中的唯一地位。

在社交產品領域,設置多個不同排序方式的流讓用戶自主選擇可能是當前一種較好的解決思路。

新浪微博此前推出的“新浪微博國際版”客戶端,一直保持時間排序的方式,便是多流共存的一種模式。本次在主客戶端中“最新微博”功能的迴歸,給了更多微博用戶以自主選擇的權力。

而Facebook對主信息流的算法調整,減少內容分發,讓用戶看到並參與更多“有意義的”內容,這裡的有意義指的是人的互動,評論、轉發和分享,並計劃建立嚴肅內容的另一個流的做法也是希望“社交的歸社交,媒體的歸媒體”。

事實上,在微信中一直存在這種多流並存,微信的“朋友在看”提供的是社交排序、“精選”則是個性化排序、“訂閱號頁面”是時間流排序、“朋友圈”則是將嚴肅內容與社交內容區隔開來。

而在純粹的內容平臺中,給“信息流”設置截斷功能便是一種嘗試的方向。例如Netflix的“信息流”隔斷功能,將影片按照內容等要素進行細分,用戶先選擇興趣點再進入“信息流”,用戶既有可能被多元化的內容吸引,也不會因無限的信息更新造成信息過載。

一些平臺還選擇了將自動化的信息推薦變為半自動化,為用戶的選擇權做出讓步。例如通過“查看更多”功能選擇是否繼續閱讀,通過“不感興趣”標籤主動過濾內容,通過用戶對信息的標註對內容進行評級或屏蔽。

然而也有聲音認為人的篩選機制並不如算法穩妥高效,同時給予用戶太多的主動性丟掉了推薦流的本質與初衷。因此如何更好地平衡算法與用戶參與度中尋找平衡仍是未來需要探究的方向。

在關於對個性化信息流的批判上,有許多聲音往往導向於平臺利益與用戶體驗並不能共生。但反觀個性化信息流過去十年在產品界走向巔峰又跌落神壇的路徑,恰恰說明從長期來看用戶體驗與平臺利益實際上是相互依賴的關係。

對於互聯網公司來說,找到每一個階段恰當的平衡點,便是成功的關鍵。

— END —

作者:湯甜、王健飛,公眾號:騰訊研究院(ID:cyberlawrc)

來源:https://mp.weixin.qq.com/s/nMZzLkEe7Cfk6Wu5560m9w

題圖來自Unsplash,基於CC0協議

相關推薦

推薦中...