它是大數據新三板第一股,見證著大數據落地中國的6年 從萌芽期到寒冬

大數據 新三板 風投 人工智能 億歐網 2017-06-26
它是大數據新三板第一股,見證著大數據落地中國的6年 從萌芽期到寒冬

說到數據,大家並不陌生,從分類方式上,可以分為結構化數據(企業ERP、財務系統等)和非結構化數據(視頻、語音數據為主)。按數據佔比情況劃分,非結構化數據佔比80%,而結構化數據僅佔20%,過去的數據分析主要是基於結構化數據做應用和優化,但是80%的非結構化數據被閒置,基於人工智能技術的蓬勃發展,非結構化數據的價值挖掘開始成為熱點,數據堂的發展背景大抵如此。

數據堂主要業務是提供數據採集、製作、共享和增值服務的數據資源運營商。上游對接數據擁有者,下游對接數據使用者。數據堂並不是從事具體的行業應用開發,因此在C端的認知度並不高,但是對於B端數據應用類型的企業而言,是非常熟悉的。提供類似服務的公司還包括海天瑞聲和標貝科技,這三家公司的業務類型各有差異。

成立於2011年的數據堂,齊紅威認為自己見證了中國大數據行業的誕生與發展,2011年從業者開始炒作大數據概念,2012-2013年找業務方向。2014年創立公司,2015-2016年出規模,大數據中國落地的前6年大概如此。

然而先到者有福利,齊紅威在融資路上一直走得比較順,創業初期自有資金探索模式,2014年初,數據堂拿到田溯寧雲基地和國泰創投1300萬元的pre-a輪融資,2014年底掛牌新三板,成為大數據行業第一股,2015年5月完成由達晨創投領投的A輪融資4200萬元,最近的一輪融資是2016年獲得2.4億元人民幣B輪融資,由中航信託、海通證券、東方證券、浙商資管、青島華通、安徽國富共同出資。

人工智能對數據有強依賴性,數據堂強勢佈局

數據堂的模式好比石油領域的中石油和中石化。三段論:第一階段獲取原油,第二階段將原油做深度的加工,提煉成品標準油產品,第三階段面向加油站或者特殊行業提供標準油產品。數據領域同比也差不多,第一階段給有數據的單位做深度合作,獲取數據的使用權,第二階段,將數據分析、處理、融合,做成標準的數據產品,第三階段,將標準的數據產品賣給具體的行業應用企業。

數據堂營收分數據租賃和數據交易兩種模式,對於中小型客戶,他們希望低成本地訓練算法模型,數據集對於模型訓練只需要用一次,數據集本身價格貴,因此可以租賃使用的模式。客戶將算法模型部署在數據堂的服務器上,數據堂提供數據集給予模型做單次訓練,訓練結束之後,客戶帶走模型,留下數據集,這相當於客戶租賃了數據集的單次服務。另一種模式,對於大企業而言,他們有充足的資金,願意購買數據集,那就直接售賣數據集。

同理,政府、電信運營商等單位數據,客戶發出需求,數據堂將算法模型部署在數據提供商服務器中,最後只能取走算法模型,數據不能帶出門,另一個考慮,數據量很大,儲存成本不小,所以齊紅威更願意將模型部署到數據提供商的服務器中。“這是行業目前最有默契的合作模式,各取所得”,齊紅威暗示。

數據堂最大的收入來自於人工智能行業,最大的客戶也來自於人工智能行業,齊紅威認為,現在人工智能行業對數據的需求遠沒到飽和的狀態,以人臉識別公司為例,人工智能在每個百分點精度提高都離不開海量的數據集訓練,而且很多人工智能企業有海外拓張的需求,而國內的人臉數據集就不能滿足海外算法產品模型的需求,需要根據當地的人臉數據集重新對模型進行訓練,因此,人工智能對數據的依賴是很大的。

齊紅威認為,人工智能比電商、搜索引擎、大數據這幾波的商業空間都要大,因為它是無孔不入的,能夠進入到任何一個領域和行業進行產業升級和結構化調整,這麼大的商業空間,而人工智能才剛剛開始。

齊紅威的戰略是“廣積糧、築高牆、緩稱王”

區別於海天瑞聲簡單的數據服務(採集、清洗、標註),數據堂特徵是做行業化細分數據產品,以無人駕駛為例,無人駕駛行業需要的數據是多樣的,包括路況數據、地圖數據、指示牌數據、紅綠燈數據等,數據堂能根據行業特徵,系統性、多維度地收集數據,滿足行業化需求。

數據堂通過行業型的數據產品方案,讓數據能夠定製化的貫穿一個領域,當領域做透之後,這個數據就具備重複使用、規模化的能力,齊紅威認為“向前多走了一步”,只有行業化的數據產品才能產生更大的附加價值,才能提升營收規模和利潤率。但同時意味著需要多維度的數據、龐大的存儲基礎、豐厚的流動資金,做數據產品的特徵明顯,前期投入大,後期投入少,營收規模則相反,前期營收少,後期營收多的交叉型商業模型。

這種商業模式的創業風口,齊紅威認為“已經沒新機會了”,也正是由於數據堂做得比較早(成立於2011年),並且成為新三板大數據交易與服務產品第一股,才有機會在屢次資本寒冬中持續融資,三次融資下來,積累發展資本將近3億元。

它是大數據新三板第一股,見證著大數據落地中國的6年 從萌芽期到寒冬

齊紅威很喜歡上述的gartner曲線,並且對大數據行業進行代入分析,他總結:2011年是萌芽期,歷經2012、2013、2014年的爬坡發展,到2016年進入行業狂熱期,在2017年進入到下滑通道,將有大量的、產生不出實際價值的企業死掉,誰能熬過幻想破滅期,誰才能真正的活下來。在2017年的時間節點,齊紅威的戰略是“廣積糧、築高牆、緩稱王”。

應用人工智能技術,數據標註和加工從勞動密集型到技術導向型

自2011年成立至今,數據堂通過自行採集和購買的形式,已經積累自有數據規模超過2000TB,而其中人工智能的數據佔據大半。在數據堂庫存中的數據是結果型的優質數據(被訓練好的算法模型或者已經做好標註的數據集),而不是原始數據。

齊紅威將數據堂定位是科技型公司,希望將公司輕盈化,很多勞動密集型的工作,他都以眾包的形式對外輸出,數據堂聚集了50萬有線下數據採集能力的兼職人員,他簡稱為“眾客”,這50萬的眾客身份各異,有學生、家庭主婦、專業發音人等,數據堂通過一個APP實現派單和項目跟進管理事項,讓任務通過眾包的形式得以完成。

現實生活中的80%數據是非結構化數據(圖片、視頻、語音),這種數據在使用之前,必須從非結構化數據變成結構化數據,而箇中技術就是人工智能的技術。數據清洗、標註、加工等原本是勞動密集型工作,在數據堂將成為一個技術導向型的工作。

它是大數據新三板第一股,見證著大數據落地中國的6年 從萌芽期到寒冬

以數據標註為例,數據堂做數據標註是半自動化的流程,假設有100萬張人臉圖片需要打標註點,首先以人工形式標註10萬張,然後用10萬張圖片去訓練一個打標註點機器人,讓這個機器人擁有標註的能力,最後讓眾客基於機器標註的圖片再進一步檢查即可,整個過程減少了大量的人工標註的工作,解放了大量的勞動力。

數據堂的資本佈局

在2016年,數據堂在貴陽設立了子公司,在此之前已經在中美兩地建有4家全資子公司,並在北京、南京等地設有5個專業數據處理中心。而這次在貴陽設立子公司,主要是看到政府逐漸在開放數據資源,因此希望在貴陽提前佈局。

在資本佈局上,2016年數據堂和將門創投共同發起設立大數據產業戰略投資基金,數據堂作為LP出資3000萬人民幣,將對大數據產業鏈上下游相關業務公司進行戰略投資,齊紅威想構建一個健康的大數據生態,在2016年投資食藥網就是很好的開局。

在採訪的最後,齊紅威總結像數據堂這種數據資源提供商,對數據的提煉程度、對數據的挖掘能力是企業核心競爭力,隨著客戶的行業化越來越深入,對數據要求越來越高,很考驗數據資源提供商的數據處理分析能力,因此,數據堂是一個技術導向型的產品公司。

本文作者極客王子,億歐專欄作者;微信:liangjiemin-2016(添加時請註明“姓名-公司-職務”方便備註);轉載請註明作者姓名和“來源:億歐”;文章內容系作者個人觀點,不代表億歐對觀點贊同或支持。

50

55

相關推薦

推薦中...