對於我們而言,大數據並非是一個空洞的商業噱頭

大數據 工程師 投資 金融 互聯大數據 互聯大數據 2017-11-08

有很多人都說,大數據就是泡沫就是概念,比如世界上最大的金融數據公司Bloomberg,看起來它提供的金融數據服務在深度上並不複雜,而且其成立時間遠早於大數據這個詞彙出現的時間,但是你很難說,Bloomberg不是一個金融大數據公司。但是,大數據概念的出現,正是由於數據發展進步到今天,傳統的處理數據的工具已經遠遠跟不上時代的腳步,才有了大數據的提法,這種提法很概括的描述了這種爆炸式增長的數據群體,並非全是泡沫。對於我們還是很有指導意義!

對於我們而言,大數據並非是一個空洞的商業噱頭

對於投資人和創業者而言,大數據是個熱門的融資標籤。就和前幾年流行的 SoLoMo,這幾年火爆的 P2P 一樣,大數據是資本泡沫的催化劑。如今任何一家(移動)互聯網公司都忙著把自己標榜為大數據公司,或者乾脆說自己是一家數據公司。遺憾的是,大多數中國的互聯網公司都是流量驅動的企業。與其說這些公司是大數據公司,不如說它們是數據採集公司。是的,每一家互聯網公司都是數據公司,因為數據(Data)是比信息(Information)要狹隘得多的詞彙。換句話說,任何一家 IT 行業的公司天然地都是數據公司。但是非 IT 公司同樣可以是數據公司,例如房地產企業和汽車銷售公司——畢竟他們優質低價地將顧客的信息轉賣給任何感興趣的個人或實體。遺憾的是,中國並沒有幾家 Pure-Play 的數據公司,因此中國不太可能出現 Palantir 這樣偉大的企業。我不幸見過一兩家國產獨角獸企業的技術/數據負責人,他們似乎並不瞭解這家 CIA 投資的創業公司,但這並不妨礙他們把自己的公司定位為世界級的大數據公司。我可以臆測,國內這些獨角獸企業的道德底線遠遠低於(為美帝情報機構服務的) Palantir,只是它們還沒有足夠的人才和技術來充分挖掘數據中的有效信息。

對於我們而言,大數據並非是一個空洞的商業噱頭

對於大多數互聯網公司或者工程師而言,大數據實際上只有一個意思,就是把一堆亂七八糟的數據扔到 HDFS 上面然後進行計算。計算的工具有很多,最常見的是 Map-Reduce,但是技術一直在演進,現在還流行 Impala、Spark、Presto 什麼的。對於這些搞大數據的工程師而言,這是一個非常好的事情,因為要把這麼多異構的數據和系統跑起來,需要很多人寫很多代碼,還需要有人來做運維。這麼一個部門總得需要幾十臺機器否則還不如單機計算能力強,工程師也得有十來人。然後可能還需要數據分析師,否則這部門跟擺設也沒什麼區別。如果系統做得不錯數據量也有了,總得配個數據科學家搞點數據挖掘或者機器學習什麼的吧。所以大數據這件事情可以解決很多就業問題,畢竟很多上了規模的互聯網公司都想搞大數據。

對於我們而言,大數據並非是一個空洞的商業噱頭

但是對於消費者或者互聯網所謂的“用戶”來說,大數據卻是另外一個意思。大數據的意思就是儘可能地蒐集跟終端消費者相關的隱私,然後進行營銷。從理論上說,大數據公司通過蒐集用戶行為,可以更好地瞭解消費者的需求,增強用戶體驗。但是在實踐上,這些所謂的智能推薦還停留在很初級的階段,因此會有人在淘寶上搜索棺材結果在微博上不停地看到跟喪葬相關的廣告。對於微博這樣的公司,還意味著它會傾向於通過直接或者間接地暴露你的隱私來獲得商業利益。據說,評價一家國內公司的大數據能力是跟被查水錶的頻繁程度正相關的。就目前而言,大數據對於終端消費者更多的是“被實名”。舉一個例子,如果你在 Android 手機上使用 Facebook 賬號訪問某個 App,那麼對不起,你在這個手機上的所有行為都有可能被 Facebook 關聯到你真實的身份上。在這種能力上,國內的三巨頭排序大概是 T > A >> B。所以最後這家公司的 App 特別流氓甚至超越了數字公司,如果你想幫幫這家公司就多用用他家的地圖或者訂點外賣。

對於我們而言,大數據並非是一個空洞的商業噱頭

相關推薦

推薦中...