中國kaggle身價暴漲,不只因為谷歌還有這張薪資榜

大數據 Kaggle Google 移動互聯網 翔snowman 2017-03-29

谷歌本月收購Kaggle後,還是想不通大數據競賽平臺能火?競賽平臺這種商業模式似乎背離了“高頻”、“痛點”、“剛需”三大優秀互聯網產品的特色?不過競賽平臺做的可不僅僅是競賽。

硅谷的喧囂,總能帶來大洋彼岸的悸動。

本月,谷歌宣佈收購大數據競賽平臺企業Kaggle之後,中國的Kaggle們估值暴漲。儘管它們成立不過一兩年,舉辦的競賽也就二三十場,團隊規模基本在30人以下,融資還處於從0到1的起步階段,但卻因為谷歌之舉而備受關注。

大數據競賽平臺何以得到資本的關注?就優秀互聯網產品的“高頻”、“痛點”、“剛需”三大特點而言,競賽平臺貌似都不吻合,不少人也會質疑這種商業模式為什麼也會火?

競賽平臺
DataFountain
DataCastle
科賽網
天池平臺

上線時間

1.5年
1.5年
3年
2年

舉辦競賽

24場
19場
16場
31場
公開企業用戶

中國計算機學會、百度、騰訊、阿里、京東、搜狗、國家電網、中國移動、中國聯通

成都市人民政府、融360、電子科技大學、優易數據、臥龍大數據、現金巴士、BBD、國家氣象中心、貴陽市公安交通管理局、尋道科技
IBM、EMC、華為、中國聯通、攜程、拍拍貸、華院數據、雲從科技
除阿里巴巴外不詳
人數
15
30
8
不詳

1

Kaggle的傳奇沒那麼簡單

其實,Kaggle已經經歷7年之癢,最初誰也沒有想到它能得到資本的青睞。

隨著大數據和人工智能的火熱,大數據技術人員大都在這個競賽平臺上“比過武”“交過手”,再加上社區機制和評級體系,Kaggle在C端足足吸引了超過50萬的數據開發者;另一方面,C端和B端也會相輔相成,大批頂尖企業為各類商業算法問題在Kaggle上發起競賽,尋求解決方案,自然會吸引更多的優秀人員競賽。

這樣的企業也就自然成了谷歌必取的囊中物,但中國Kaggle們也能如此幸運嗎?細究起來可沒那麼簡單,比如:

中國數據人才無論從質量到數量目前都尚不能堪比美國;

為什麼偏偏是數據競賽平臺,而不是其他同樣火爆的技術,比如雲計算、移動互聯網;

競賽平臺和眾包平臺本質上都是一種眾包,但區別在哪裡?

大賽之外建立的社區,和垂直類技術社區甚至媒體又有什麼區別?

如果針對數據人才做進一步培訓招聘,又和在線培訓機構已經招聘網站有什麼區別?

……

如果不能從邏輯上清晰想通以上問題,在這個贏者通吃的市場,任何相鄰領域的巨頭都可能搶食kaggle剛剛創下的果實;如果能夠想透以上問題,才會做出差異化產品,形成真正的行業門檻。

2

Kaggle模式中國也會水土不服?

茱比莉聯繫到了DataFountain聯合創始人&COO陳娟。這家被業界認為最像Kaggle的中國創業企業,核心業務貌似Kaggle,都分為數據競賽服務和大數據社區兩個部分,但她卻表示商業模式大為不同,或者說Kaggle只是其中一個子集。

一般,數據競賽週期為一到三個月,而大數據社區的建立則解決了競賽平臺的低頻問題。如何在社區中留住大數據技術人員則非常講究:

是如垂直類技術媒體一樣推送內容,還是如技術社區一樣看重交流互動;

是做技術培訓平臺還是做獵頭招聘生意;

是眾包模式還是做評分體系……

到底做成什麼樣,得回到“痛點”和“剛需”這兩個關鍵詞。

雖然競賽不是剛需,但中國數據人才的缺口卻是整個行業的痛點,數據人才的培養也就成樂整個行業的剛需。

看看美國Indeed.com招聘網站剛剛發佈的“2017最佳工作崗位”排行榜,軟件工程師按照薪水排名的TOP10工作崗位中,與大數據、人工智能相關的職位搶佔了前三位。不言而喻,所有軟件技術人才會因為這樣的市場需求而對趨之若鶩。

排名
職位
需求數/百萬職位
平均薪資
2013-2016職位需求增長率
1
機器學習
58
$134306
36%
2
數據科學家
360
$129938
108%
3
計算機視覺工程師
20
$127849
34%
4
開發運維工程師
731
$123165
106%
5
雲工程師
217
$118878
67%
6
高級審計經理
53
$118692
52%
7
滲透測試工程師
317
$115557
52%
8
Oracle人力資本管理
44
$113107
41%
9
全棧開發人員
641
$110770
122%
10
Salesforce開發人員
230
$108089
83%

而中國大數據軟件人才起步晚於美國,如果說Kaggle上的人才叫做數據科學家,那麼中國競賽平臺的入門門檻會從數據愛好者開始。他們在參賽之前恐怕更需要的是培訓,並通過培訓實現分級。針對大數據人員的不同,也造就了中美競賽平臺基因的不同,比如Kaggle就只需評分系統而無需培訓系統。

只有瞭解中國大數據人才的需求才能做出他們需要的產品,這也決定了大數據競賽平臺社區內容的取捨。中國大數據人才在社區上打怪升級也好,參與競賽也罷,歸根結底為了兩大剛需:考證和排名。

因此,DataFountain將主要精力放在培訓工具和排名體系的構建上,而將培訓內容作為競賽平臺的開放組成去吸引優質培訓機構構成生態圈層,最吸引人的競賽排名也只是評分體系中的一個指標,結合中國大數據人才現狀,將工具、培訓,評級,競賽構成一體化社區內容,從而產生更強的粘性。

3

只有大數據才能讓競賽平臺受到追捧?

再回到競賽本身。

為什麼只有大數據競賽平臺能夠交付這樣的商業模式?DataFountain道出了它的本質:

傳統IT行業中,四五個人一個團隊,開發一個APP或者是一個創新的商業模式,很快就會被大公司模仿。但在數據挖掘和算法領域,往往一個小團隊甚至是一個人的研究成果,就可會比幾百人團隊的智慧結晶更為高效,這就是大數據的行業性質。

這就不難理解,從來沒有一個細分的IT行業能讓那麼多大學教授“下海”來到企業當中,從美女人工智能專家李飛飛,到最近因為離職百度而刷爆朋友圈的吳恩達;谷歌、微軟、IBM、百度都在全球搶奪最頂尖的數據科學家、人工智能專家。

這也使得大數據競賽平臺就如眾包平臺一樣受到企業歡迎。因為對於2B端的企業而言,大數據競賽一方面可以解決具體的實際問題,另一方面可以推廣企業的自有品牌,還能夠招聘到頂尖的大數據人才。

不過DataFountain做的又不是大數據領域的“豬八戒”(最火的眾包平臺)。

陳娟認為,傳統的眾包模式不是競賽性質的平臺,而是偏服務性的獎賞平臺。儘管企業發出的任務都適合小團隊運作,但眾包平臺偏重低價者勝;而競賽平臺中,企業願意花重金懸賞最優質的項目。這是因為,與大數據競賽平臺的內容不同,眾包項目多是體系成熟的大眾化服務項目,比如設計logo和網頁,重要的是要建立一套服務評價體系,使得小團隊可以在平臺上可以展現自身服務水平,從這點上看又有點像淘寶平臺。

那麼,到底2C端還是2B端才是競賽平臺的價值核心?

這和“雞生蛋還是蛋生雞”的問題並不相同。雖然兩者聯動明顯,但只有優秀競賽才能吸引優秀參賽者,至少競賽平臺早期的門檻應該是2B端有影響力的頂級客戶合作。這樣是為什麼DataFountain一直強調它的優勢在於早期正是抓住了行業制高點——CCF中國計算機學會,這裡既有學術界泰斗,又有企業界精英,這為它後來簽下BAT、京東、國家電網、中國移動、中國聯通等大型企業樹立了品牌口碑。

作為一箇中國新生又被美國驗證的全新商業模式,大數據競賽平臺才剛剛起步,還有很多路要走,很多坑要過。中國Kaggle們的命運如何,現在判斷還為時尚早。

翔snowman 原創出品

科技茱比莉

有視角的科技觀察 有態度的科技評論

相關推薦

推薦中...