在大數據成為熱詞的當下,你真的知道什麼是大數據嗎?
一起聽聽著名管理學家、清華大學經濟管理學院EMC講席教授陳國青談如何理解大數據。
大數據雖然是近年來的熱詞,但它並非憑空產生,而是時代演化的產物。當信息技術發展到雲計算、大數據時代,人們的生活發生了巨大變化,從基礎研究方法到各個學科,人們普遍感受到大數據的迫近。如今大數據與人們的生活聯繫十分密切,RFID、傳感器、手機、可穿戴設備、車載設備等每時每刻都在蒐集信息,每個人都是數據的接收者,也是數據的生產者。大數據從特定的領域進入社會生活,是信息技術與社會生活融合產生的質變。
陳國青教授一直致力於數據研究,關注信息變化對管理的影響。近些年來,陳國青教授在大數據領域投入了大量的精力,從2015年開始,他同時還擔任國家自然科學基金委“大數據驅動的管理與決策研究”重大研究計劃專家指導組組長,率領國內同行一起探索大數據前沿問題。
大數據的數據特徵
據陳國青教授介紹,大數據的數據特徵,可以從幾個方面來概括,比如4V:volume(容量)、variety(種類)、velocity(速度)、value(價值)。
第一,大數據意味著超規模(Volume)。大數據的規模從一般意義上講具有大規模、海量的含義,但是沒有絕對的量綱標準,而是和領域及其問題相關。超規模是指超出了原有領域和問題的大規模。比如企業大數據,與之前不同的一個地方在於,此時的數據規模常常超越了企業本身傳統的內部數據邊界,而是延伸到了企業外部,成為一種社會化的企業數據。每個人作為終端使用者,既是數據的使用者,又是數據的創造者。
第二,大數據意味著多樣性(Variety)。富媒體(Rich Media)大大擴展了人們的數字化生活體驗,全球數據和數字流量中 80%以上 都是文本、視頻、語音、圖像,而不是過去以二維的、規範化的、非常簡單數據形式為主的結構化數據。多樣性成為大數據的顯著特徵。
第三,我們處在數據的海洋之中,但與我們企業或個人相關的數據相對說來是很少的,所以是低價值密度的(Value)。即,數據量的分母太大,對企業或個人決策有價值的信息佔總量的比例就很小。所以這裡有一個重要的含義,即如何從低價值密度的數據海洋中挖掘出有用信息,成為企業數據分析的關鍵。
第四,大數據的實時性強(Velocity)。信息就像開著的水龍頭一樣,源源不斷地出來。人們打開手機看新聞,支付賬單,都需要得到及時響應,而不是等到晚上再看新聞,要排個隊才能支付賬單。數據是連續的,實時的,流湧的。這種流數據是時時刻刻(Real-Time)的,構成了大數據之“大”和無時不在。
大數據的這四個特徵會給人們的科學研究方法帶來挑戰,當然也會影響商業和管理。
大數據的問題特徵
陳國青教授認為,大數據的問題特徵主要從三個方面來衡量——粒度縮放、跨界關聯和全局視圖。
粒度縮放指的是問題的要素是否被數據化了。數據粒度就像一個個小像素,這些像素使得問題的要素不僅能夠被描述,而且能夠被精確測量,也能夠像地圖那樣放大縮小。如果問題裡有人,就需要考慮人能不能通過數據進行測量,如何進行測量。
大數據問題還引入了新的視角,即需要進行跨界關聯,將傳統視角和邊界之外的相關要素納入到管理決策中。過去的旅遊景點排隊常常只考慮人多不多,視角比較單一,但如果考慮到景點附近的酒店信息、天氣信息、交通信息、活動信息等等,就需要引入外部視角,並且廣泛蒐集相關數據,這時候就會變成大數據問題。
全局視圖是指問題定義與求解的全局性,強調對相關情境的整體畫像及其動態演化的把控和詮釋。這需要基於數據分析和平臺集成的全景式“成像能力”。
以共享單車為例,通過車載傳感器、定位系統以及智能手機終端等設備獲得調度和管理需要的“人-車-路”粒度信息;同時打通導航、支付、通訊、商鋪以及餐飲等諸多業務功能,實現跨界聯動;進而,企業和平臺可以從全局出發,形成整體畫像,並優化佈局和運作,並作出相應的管理決策。這樣的話就體現了大數據問題的粒度縮放、跨界關聯和全局視圖特點。
大數據與管理決策
陳國青教授指出,大數據的管理決策特徵,主要體現在當決策者面臨“發生了什麼?”“為什麼發生?”以及“將發生什麼?”的問題時,如何在業務層面瞭解業務的狀態、業務間聯繫以及業務的未來發展,對應在數據層面就是狀態數據的粒度、狀態的關聯與因果、以及狀態的全景式動態演化。特別值得一提的是,社會上的“大數據只講關聯不講因果”說法存在誤導,因為管理決策既要講關聯,也要講因果。
此外,在技術層面,數據本身是中性的,但當與管理決策結合之後,數據涉及到人的價值觀判定,涉及到場景和具體問題,在對數據的利用上也就變得不那麼中性了。這和其他科技一樣,可能成為一把雙刃劍,用得好可以服務人類,用得不好很有可能會有副作用。
大數據與被遺忘權
隱私洩露或許就是大數據的副作用之一。設想一下,當你去點披薩,店員可以通過你的卡號瞭解到你的工作電話、生活電話,根據醫療記錄為你排除高脂的食品,在選擇付款方式時也可以瞭解到你的銀行卡使用情況……
陳國青教授特別提到,當個人數據被大量蒐集和記錄,被遺忘的權利也變得重要起來。
歐盟早在1995年就在相關數據保護法律中提出了“被遺忘權”概念,任何公民可以在其個人數據不再需要時提出刪除要求。歐盟委員會從2012年開始建議制定關於“網上被遺忘權利”的法律,提議包括要求搜索引擎修改結果,以符合歐盟保護個人信息的方針。 2014年歐盟法院對“岡薩雷斯訴谷歌公司案”作出的判決支持了岡薩雷斯關於要求谷歌刪除其拍賣信息的鏈接,至此,被遺忘權在歐盟通過司法判例正式確認。2018年5月正式生效適用的《歐盟數據保護通用條例》則以歐盟法律的形式正式確立了被遺忘權,並且規定了被遺忘權行使時的必要條件和限制條件。
(本文根據人文清華對陳國青教授的獨家訪談整理而成。)
他曾放棄國外知名人工智能實驗室的邀約,毅然回國。
他潛心開發多個研究中國企業管理問題的哈佛案例,為世界管理學帶來中國視角。
他曾獲中國管理學界最高榮譽——復旦管理學傑出貢獻獎。
他連任兩屆國際模糊系統協會副主席,是中國內地第二位獲得IFSA Fellow殊榮的人。
四十年“數據”生涯,他如何跨界,又為推動中國管理學與信息技術進步做了哪些貢獻?
面對大數據時代,他有怎樣的思考?
跟隨人文清華走近著名管理學家、清華大學經濟管理學院EMC講席教授陳國青,瞭解大數據時代和大數據思維。
陳國青,清華大學經濟管理學院EMC講席教授,學術委員會主任。2005年度受聘教育部長江學者特聘教授。陳國青教授曾獲國際模糊系統協會2009年度“IFSA Fellow”;復旦管理學獎基金會2007年度“管理學傑出貢獻獎”;1999年度國家傑出青年科學基金;全國百篇優秀博士論文指導教師等榮譽。主要研究與教學領域為商務智能與電子商務、IT戰略與管理、模糊邏輯與數據模型。
陳國青教授還擔任教育部高等學校管理科學與工程類專業教學指導委員會主任委員,國家信息化專家諮詢委員會成員,國際信息系統協會中國分會(CNAIS)創始主席(2005-2013),國際模糊系統學會(IFSA)副主席,中國信息經濟學會副理事長,中國系統工程學會副理事長,中國管理現代化研究會副理事長,國際商學院PIM聯盟聯執主席(2010-2013)等職。
同時還擔任國家自然科學基金委大數據重大研究計劃指導專家組組長,主持國家自然科學基金委重大項目(新興電子商務領域)等多個國家級科研項目,以及多個國際合作、企業信息戰略和管理項目。
什麼是大數據?
什麼是大數據思維?
算法經濟時代什麼時候到來?
大數據殺熟合適嗎?
大數據時代是否應該擁有被遺忘權?
大數據將如何撞擊未來?
6月10日(週一)晚7點,清華大學新清華學堂,人文清華講壇,著名管理學家、清華大學經濟管理學院EMC講席教授陳國青,為你深度解讀:大數據,顛覆的力量
- 特別提示
從2016年4月19日起,清華大學“人文清華講壇”系列活動列入《文化素質教育講座》課程,並按該課程要求舉辦,請在讀本科生提前領票,憑票並攜帶學生IC卡刷卡入場,入場時間為演講當日18:30。
- 活動信息
【演講題目】大數據:顛覆的力量
【開講時間】2019年6月10日(週一)19:00
【入場時間】18:30
【地點】清華大學 新清華學堂
- 贈票贈書活動
關於大數據,你有什麼問題希望向陳國青教授求教?歡迎關注“人文清華講壇”微信公眾號並積極留言。
我們將選取精彩留言進行抽獎,抽取50位贈送入場票,10位贈送陳國青教授的書籍《數據·賦能——“造”與“用”視角》(僅限講壇當日現場領取)
- 領票攻略
【領票時間】6月6日 週四 12:00開始領票 領完即止
小提醒:新清華學堂票廳將於端午節6月7日(週五)放假一天, 6月8日(週六)起正常售票
【線下領票地點】新清華學堂票廳(新清華學堂東南角)或學生服務中心總服務檯109房間
【領票辦法】持本人高校或中學學生證/教工證,每人每證限領兩張
【線上搶票二維碼】關注“人文清華講壇”微信公眾號,陳國青教授相關文章內容最下端獲取搶票二維碼。
- 直播地址
【直播鏈接】http://c.m.163.com/news/l/206868.html