Google是如何吞噬了這家網站的?

Google 梅威瑟 好聲音 宋飛傳 36氪 2017-04-21

編者按:這是一則反映Google對小企業影響力的故事。CelebrityNetWorth.com,一家提供名人身價信息的小網站,因為不願意配合Google免費提供數據,被搜索巨頭直接拿來主義,使得網站流量1年之內下降了65%,公司裁員了一半。所有打算靠搜索流量謀生的創業者都要好好想想,如何才能不被人掐住脖子,如何才能與大象共舞。包括Google在內的內容聚合者更應該好好反思,小心引起寒蟬效應。

Google 搜索結果裡的 Featured Snippets 小卡片直接顯示答案,用戶就比較不用從搜索結果裡點擊鏈接了,這也導致很多依賴搜索引擎引流的網站的訪問量大幅度下降

誕生於2008年的CelebrityNetWorth.com之所以出現,是因為學金融的Brian Warner在一家數字媒體公司工作時很好奇Larry David值多少錢。

“說實話,我想知道Larry David到底有多少錢。我想《抑制熱情》剛剛回歸,於是我想‘上帝,他一定從《宋飛正傳》賺了很多的錢。’我去Google查了類似‘Larry David淨值’這樣的東西,結果出來的都是垃圾。”

按照CelebrityNetWorth.com的說法,Larry David現在的身價是4億美元。Warner承認這不是確切的數字,但這個數字不是他和自己的員工隨便亂想出來的。他們翻看了房地產交易、數額較大的購買和薪水支付,有時候甚至還跟名人或者名人的代表聯繫求證。弗洛伊德·梅威瑟的身價Warner估計是被Google最多的,這位以花錢大手大腳著稱的拳王甚至給網站傳了自己資產賬戶的截圖。

不過Warner警告說:“我不建議你把我們的這些數字用到訴訟案上面去。但我絕對可以打包票的是,在名人身價方面任何時候我們的資料都是你在互聯網上能找到的、最準確的信息。”

名人身價多少這個問題火了,火到2012年Warner可以連原來的工作都不要全身心投入到這個網站上。他說網站最高峰的時候一度擁有12名員工。

然後Google插了一腳進來。

大部分時候Google的表現都是像圖書管理員一樣。你提出問題,它引導你去到web上有可能找到答案的地方。

Google是如何吞噬了這家網站的?

在接受“Google會不會犯錯”這個問題查詢時Google的直接回答

但是過去5年的時間裡,Google一直在進行當聖人的實驗。輸入問題,然後你可能會在搜索結果頁面頂部看到一個方框,裡面用加粗體標註了相關問題的答案。復活節是什麼時候?誰贏得了《美國好聲音》?狗可以吃壽司嗎?

Google是如何吞噬了這家網站的?

搜索“狗可以吃壽司嗎”返回的Featured Snippet(精選摘要)片段,截圖時間是2017年4月17日

這些回答當中有一些包括了源自Google編撰的Knowledge Graph(知識圖譜)數據庫的信息。大部分數值型和日期型的問題答案都出自這裡,此外有些答案是從Google所信任的維基百科抽取出來的。

但有些回答是沒有辦法人工編撰的,而是利用算法從網上抽取出來的。這些叫做“Featured Snippets(精選摘要)”,在過去已經給Google惹來了麻煩,因為該搜索引擎無意間突出顯示了一些帶有種族主義、性別歧視或者明顯錯誤的回答。

最終目標是增強用戶進行Google搜索的體驗……

2014年,Warner收到了一封Google的郵件,詢問他是否對免費讓該公司訪問他的數據來給知識圖譜取材感興趣。

以下是這封郵件的片段:

我們收到了大量有關名人身價方面的搜索查詢。有人讓我找一個權威的來源,現在我正在研究Net Worth of Celebrities數據集的信息源。最終目標是增強用戶進行Google搜索的體驗……我正在評估你的網站,你的收集看起來似乎挺全面的……如果你能共享一小部分數據集,也就是大概10位名人的元數據到電子表格裡面的話,將有助於我和我的團隊評估,看看是否符合我們的條件。

如果同意的話,這將意味著對名人身價的任何Google搜索都將返回抽取出來的答案。答案將包括到Warner網站的鏈接,Google向他許諾說此舉將有助於網站打響品牌。但這也會急劇削減他的流量。大多數人只是想知道數字,對於這些數字是怎麼得出的並不在意。所以Warner拒絕了。

他說:“我不知道這對我們有什麼好處。我要給它打上一個大大的問號,就好像說‘嘿,讓我們挖走你手上最值錢的東西,那些你花了好幾年數百萬美元才搞到的東西,然後免費給我們好顯示出來。’所以最後我們迴應說‘我們對這種做法感到不舒服。’”

“但隨後他們更進一步把數據取走了。”

Warner說,2016年2月,Google開始展示CelebrityNetWorth數據庫中25000位名人的精選摘要。他之所以知道是因為他故意在數據庫裡面添加了幾位假名人(他的朋友)的資料,為的就是想看看這些人會不會被Google當作精選回答彈出來,結果真的是這樣。

Warner說:“我們的流量馬上急轉直下。2017年1月跟2016年1月(當時整個月他們的內容還沒有被剽竊)的流量相比,我們的流量下降了65%。”Warner說自己被迫裁掉了1半員工。(在被詢問到這種損害自身最好信息來源的舉動是否搬起石頭砸自己的腳時,Google拒絕發表評論)。

Celebrity Net Worth用了Google的廣告網絡,於是他試著通過那一塊的聯繫方式接觸Google。最後並不走運。當他意識到Google很多的精選摘要並沒有把CelebrityNetWorth的名字放上去時,他沮喪的心情遭到了雙重打擊。很多鏈接跑到了其他網站,比如房屋抵押網站Bankrate.com,可笑的是甚至那些網站也把CelebrityNetWorth作為自己的來源。

Google是如何吞噬了這家網站的?

搜索“梅威瑟身價”直接從Bankrate.com提取出來的答案,而這個答案Bankrate.com其實是援引另一來源的。

Warner承認,如果網站搜索流量太過倚重Google,而它的研究成果輕易就能被轉化為數字的話,搭建這樣的網站是有風險的。但他仍然認為Google的做法是不公平的。他說:“如果精選摘要還留下不走,沒關係。我對此已經不再計較。但我百分之一百認為我們對此應該是有功勞的。”

Google決定小企業成敗的能力顯而易見。之前其實也發生過類似的事情,去年該搜索引擎添加了“當地企業名片(Local Business Cards)”,這個東西基本上就是高亮顯示地區企業的搜索結果。其結果是,致力於讓自己的網站在Google排名靠前的當地企業突然被更新更頻繁的網站擠到了一邊。2011年Google+的推出也對小型企業有類似的效應,毀滅性的Panda更新也是這樣,這項升級本來是想打擊垃圾內容網站的,可最後把小型網站的一切都搞砸了。

Google推進直接答案的後果遠不止是依賴搜索流量的小型企業主受影響。Google2014年發給Warner的電子郵件讓我們稍微瞭解了一點Google挑選可信來源的辦法是什麼樣的。Google自己當然不會回答這個問題,但基於這封電子郵件,Google的內容審查應該是相當薄弱的,相對於數據是否正確,Google似乎對數據是否機器可達更感興趣。而精選摘要(利用算法從web挑選出來的答案)的門檻甚至還要更低,因為看起來任何在搜索結果中排名足夠靠前的網站都足以充當Google標準答案的來源。所以你才會搜到一大堆結果說奧巴馬正在組織一場政變,或者說地球是平的,或者女人是邪惡的,或者這位藝術家發明了電子郵件。

還應該引起注意的是,知識圖譜和精選摘要的答案所提供的文字也會被Google的語音助理和Google Home大聲宣讀出來——他們迫不及待推出顯然帶有瑕疵的功能的動機很大一部分就因為此。

截止到寫稿時,“Larry David的身價”以及“Larry David值多少錢”的查詢返回的都是9億美元,但來源都是Business Insider。Business Insider的故事說“據估計”Larry David身家有9億美元以上,並且鏈接到了財富市場洞察機構Wealth-X的一份新聞公告。然後再引用了CelebrityNetWorth稍低一點的4億美元,並且引用Larry David在跟Charlie Rose對話時的說法,當時他說自己身家連5億美元都不到。

Google是如何吞噬了這家網站的?

2017年4月17日Google搜索“Larry David淨值”的結果,這個結果似乎出自Google編撰的知識圖譜數據庫。

這個數字遠談不上決定性,但Google似乎願意為此背書——不管是Google自己編撰的知識圖譜還是不那麼嚴謹的從web抓取答案的精選摘要都是這樣(精選摘要通常附帶有“關於本結果”的說明,而知識圖譜的回答就沒有)。

Google是如何吞噬了這家網站的?

2017年4月17日搜索“Larry David值多少錢?”的結果,上面顯示了自動從web抓取的精選摘要。

Google的答案總是在變,有時候會有改善,但並不總是這樣,而且Google也沒有具體說明過自己是如何處理用戶通過知識圖譜和精選摘要內置的“反饋”表格提交的評論的。

關於本文Google進行了如下的迴應:

精選摘要是對搜索查詢的自動算法性匹配,回答摘要是出自第三方網站的。這些網站彙總精選摘要的底部顯示,用戶可通過Google搜索的精選摘要點擊鏈接直接進入這些網站。我們一直致力於改進算法,並且歡迎對不準確的信息提供反饋,用戶可通過點擊精選摘要右下角的“反饋”按鈕分享自己的意見。

在Warner把這個故事分享給我的2周之後,他注意到精選摘要做出了改變。Google展示的抽取結果似乎變少了,精選摘要顯然剔除了不那麼出名的名人的信息。CelebrityNetWorth的流量漲回來了,儘管還沒有恢復到原先水平。他說:“我還不能完全打開香檳,因為如果你經歷過我在過去2年所經歷的一切的話,你就會知道對於Google所做的事情永遠都不要高興得太早。這可能只是他們在推出比以前還要糟糕的東西之前的一次緩期執行罷了。”

相關推薦

推薦中...