'大數據華而不實麼?大數據的本質是什麼?'

"

大數據是否只是一個很空的概念和口號?若干年前就存在的東西,為什麼現在這麼火。現在是個人,言必稱大數據。大數據的本質是什麼?不要跟我說大數據只是“大”,它跟以往的小數據有什麼本質區別?分析方法上有什麼本質不同?

"

大數據是否只是一個很空的概念和口號?若干年前就存在的東西,為什麼現在這麼火。現在是個人,言必稱大數據。大數據的本質是什麼?不要跟我說大數據只是“大”,它跟以往的小數據有什麼本質區別?分析方法上有什麼本質不同?

大數據華而不實麼?大數據的本質是什麼?

為什麼覺得大數據華而不實?

那是因為媒體、廠商對大數據的解讀,都在給人們造成一種認知偏差,認為“大數據能分析我們身邊的一切,大數據是萬能的,抓住大數據可以獲得財富”。

但其實這是一種言過其實的說法。只不過媒體需要吹捧新穎吸睛的概念;廠商需要誇大其應用市場、商業價值來吸引融資;企業需要將自己的改革和大數據掛鉤來確保成功的可能性,表明自己是在真創新。

大數據的應用和成功可能性還遠沒有這麼成熟。

大數據的本質是什麼?

現在叫大數據,以前可以稱為信息、情報等等名字。以前的信息蒐集技術沒有這樣發達,只能以樣本信息形式出現,而且由於結構類型不同,只能分類處理,有些數據還不便於儲存和比較。為什麼現在叫大數據,是因為現代互聯網技術,可以把不同結構類型的所有數據都能蒐集到,形成全數據,並且隨著大數據技術的深度發展,這些複雜結構類型的全數據,會被自動分類比較統計,所以稱為大數據。

"

大數據是否只是一個很空的概念和口號?若干年前就存在的東西,為什麼現在這麼火。現在是個人,言必稱大數據。大數據的本質是什麼?不要跟我說大數據只是“大”,它跟以往的小數據有什麼本質區別?分析方法上有什麼本質不同?

大數據華而不實麼?大數據的本質是什麼?

為什麼覺得大數據華而不實?

那是因為媒體、廠商對大數據的解讀,都在給人們造成一種認知偏差,認為“大數據能分析我們身邊的一切,大數據是萬能的,抓住大數據可以獲得財富”。

但其實這是一種言過其實的說法。只不過媒體需要吹捧新穎吸睛的概念;廠商需要誇大其應用市場、商業價值來吸引融資;企業需要將自己的改革和大數據掛鉤來確保成功的可能性,表明自己是在真創新。

大數據的應用和成功可能性還遠沒有這麼成熟。

大數據的本質是什麼?

現在叫大數據,以前可以稱為信息、情報等等名字。以前的信息蒐集技術沒有這樣發達,只能以樣本信息形式出現,而且由於結構類型不同,只能分類處理,有些數據還不便於儲存和比較。為什麼現在叫大數據,是因為現代互聯網技術,可以把不同結構類型的所有數據都能蒐集到,形成全數據,並且隨著大數據技術的深度發展,這些複雜結構類型的全數據,會被自動分類比較統計,所以稱為大數據。

大數據華而不實麼?大數據的本質是什麼?

吳軍在他的《智能時代》裡提到對於大數據的觀點:

只有量的積累的數據,通常並不能稱之為大數據。除了大量性,大數據常常還應該具有多維性和完備性。大數據的多維性,可以理解為針對單一“個體”(人/物/事件等)不同角度的數據。比如之前提到的:收集全國所有人的出生年月,單收集這一項,數據單一缺乏意義;但如果再加入收入、所屬地區、受教育程度等等多維的信息,那數據本身就變得鮮活了。我們可以從數據中分析人口的地域分佈、經濟分佈、教育分佈等並在此基礎上給出宏觀的資源調控計劃。大數據的完備性,則可以理解為數據的全面性。比如2012年一位名叫內德·斯威爾的年輕人,利用大數據成功預測了美國50+1個州的大選結果。他其實就是在投票前利用互聯網儘可能的蒐集當年的大選數據(如地方媒體數據、社交網絡留言、朋友間評論等),從而近似的知道每個人對大選的態度,並按照州進行分類整理,最終成功預測了當年的大選結果。缺少多維性的“大數據”會讓數據承載的信息“片面”,進而導致數據本身的利用價值大大下降;缺乏完備性的數據則會由於缺乏“完備樣本”的支撐,也會使得獲取的信息“侷限性”。大數據最好還應具有“及時性”,但及時性卻並不是其必備條件,只是有了“及時性”的大數據,會實現一些過去無法做到的事情。大數據的及時性,可以理解為數據收集的時效性。一方面,要分析當前情況,就要儘可能使用與當前時間點較為接近的數據;另一方面,數據本身就在時刻產生(特別是今天的互聯網),新鮮的數據能更快速的反應當前社會的一些情況。比如使用百度地圖導航的時候,它能根據數據庫中人們當前的(及時的數據)車輛出行地點,和即將要去的地方大概估算出此人的行程規劃,並通過眾多數據的整合估算出某一路段可能的堵塞情況,進而在導航的時候給出“避免擁堵”的導航建議。

由此可見,所謂的大數據,一定要同時滿足大量、多維和完備(相對來說)的特點,並在此基礎上,最好具有“時效性”。

參考自:讀大數據 《智能時代》有感

其次,大數據的意義在於驅動決策

大數據產生價值的鏈路是:數據驅動決策——決策實踐價值。

國內企業總是談數據變現實際是一種對大數據價值的歧義理解。企業面對的TO B或TO C不是個體單維度數據而是海量多維度數據,單一數據不能提供任何決策依據。然而企業決策者往往對大數據的理解不夠清晰透徹,片面的認為數據就是價值,花錢就要見效,把重點需求放在了所謂的上文說道的“有效數據上”當然效果在短期是非常顯而易見的。而在利益驅動下企業的方向就真的隨著“數據”驅動決策了,如同你是正常人卻天天吸純氧,企業想的就不是產品緊貼市場需求、如何有效改進,增強市場競爭優勢,而是圍繞相應“數據”下進行各種營銷。

第一步,找到核心數據。核心數據現在對很多企業來說實際上就是CRM,自己的用戶系統,這是最重要的。

第二步,外圍數據。比如企業經常會在線上線下舉辦一些活動,在做活動的時候,消費者的信息只是簡單地提供在表單裡面,還是進入了CRM的系統裡?

第三步,常規渠道的數據。舉例來說一個銷售快銷品的企業,能不能夠得到沃爾瑪的數據,家樂福的數據?很多國外大數據的案例,說消費者買啤酒的時候也會購買剃鬚刀之類,或者一個母嬰產品的消費者她今天在買這個產品,預示著她後面必然會買另一個產品。這就有一個前期的挖掘。這些價值怎麼來的,這就需要企業去找常規渠道里面的數據,跟自己的CRM結合起來,才能為自己下一步做市場營銷、做推廣、產品創新等建立基礎。

第四步,外部的社會化的或者非結構化的數據,即現在所謂的社會化媒體數據。這方面信息的主要特徵是非結構化,而且非常龐大。這對企業來說最大的價值是什麼?當你的用戶在社會化媒體上發言的時候,你有沒有跟他建立聯繫?

"

大數據是否只是一個很空的概念和口號?若干年前就存在的東西,為什麼現在這麼火。現在是個人,言必稱大數據。大數據的本質是什麼?不要跟我說大數據只是“大”,它跟以往的小數據有什麼本質區別?分析方法上有什麼本質不同?

大數據華而不實麼?大數據的本質是什麼?

為什麼覺得大數據華而不實?

那是因為媒體、廠商對大數據的解讀,都在給人們造成一種認知偏差,認為“大數據能分析我們身邊的一切,大數據是萬能的,抓住大數據可以獲得財富”。

但其實這是一種言過其實的說法。只不過媒體需要吹捧新穎吸睛的概念;廠商需要誇大其應用市場、商業價值來吸引融資;企業需要將自己的改革和大數據掛鉤來確保成功的可能性,表明自己是在真創新。

大數據的應用和成功可能性還遠沒有這麼成熟。

大數據的本質是什麼?

現在叫大數據,以前可以稱為信息、情報等等名字。以前的信息蒐集技術沒有這樣發達,只能以樣本信息形式出現,而且由於結構類型不同,只能分類處理,有些數據還不便於儲存和比較。為什麼現在叫大數據,是因為現代互聯網技術,可以把不同結構類型的所有數據都能蒐集到,形成全數據,並且隨著大數據技術的深度發展,這些複雜結構類型的全數據,會被自動分類比較統計,所以稱為大數據。

大數據華而不實麼?大數據的本質是什麼?

吳軍在他的《智能時代》裡提到對於大數據的觀點:

只有量的積累的數據,通常並不能稱之為大數據。除了大量性,大數據常常還應該具有多維性和完備性。大數據的多維性,可以理解為針對單一“個體”(人/物/事件等)不同角度的數據。比如之前提到的:收集全國所有人的出生年月,單收集這一項,數據單一缺乏意義;但如果再加入收入、所屬地區、受教育程度等等多維的信息,那數據本身就變得鮮活了。我們可以從數據中分析人口的地域分佈、經濟分佈、教育分佈等並在此基礎上給出宏觀的資源調控計劃。大數據的完備性,則可以理解為數據的全面性。比如2012年一位名叫內德·斯威爾的年輕人,利用大數據成功預測了美國50+1個州的大選結果。他其實就是在投票前利用互聯網儘可能的蒐集當年的大選數據(如地方媒體數據、社交網絡留言、朋友間評論等),從而近似的知道每個人對大選的態度,並按照州進行分類整理,最終成功預測了當年的大選結果。缺少多維性的“大數據”會讓數據承載的信息“片面”,進而導致數據本身的利用價值大大下降;缺乏完備性的數據則會由於缺乏“完備樣本”的支撐,也會使得獲取的信息“侷限性”。大數據最好還應具有“及時性”,但及時性卻並不是其必備條件,只是有了“及時性”的大數據,會實現一些過去無法做到的事情。大數據的及時性,可以理解為數據收集的時效性。一方面,要分析當前情況,就要儘可能使用與當前時間點較為接近的數據;另一方面,數據本身就在時刻產生(特別是今天的互聯網),新鮮的數據能更快速的反應當前社會的一些情況。比如使用百度地圖導航的時候,它能根據數據庫中人們當前的(及時的數據)車輛出行地點,和即將要去的地方大概估算出此人的行程規劃,並通過眾多數據的整合估算出某一路段可能的堵塞情況,進而在導航的時候給出“避免擁堵”的導航建議。

由此可見,所謂的大數據,一定要同時滿足大量、多維和完備(相對來說)的特點,並在此基礎上,最好具有“時效性”。

參考自:讀大數據 《智能時代》有感

其次,大數據的意義在於驅動決策

大數據產生價值的鏈路是:數據驅動決策——決策實踐價值。

國內企業總是談數據變現實際是一種對大數據價值的歧義理解。企業面對的TO B或TO C不是個體單維度數據而是海量多維度數據,單一數據不能提供任何決策依據。然而企業決策者往往對大數據的理解不夠清晰透徹,片面的認為數據就是價值,花錢就要見效,把重點需求放在了所謂的上文說道的“有效數據上”當然效果在短期是非常顯而易見的。而在利益驅動下企業的方向就真的隨著“數據”驅動決策了,如同你是正常人卻天天吸純氧,企業想的就不是產品緊貼市場需求、如何有效改進,增強市場競爭優勢,而是圍繞相應“數據”下進行各種營銷。

第一步,找到核心數據。核心數據現在對很多企業來說實際上就是CRM,自己的用戶系統,這是最重要的。

第二步,外圍數據。比如企業經常會在線上線下舉辦一些活動,在做活動的時候,消費者的信息只是簡單地提供在表單裡面,還是進入了CRM的系統裡?

第三步,常規渠道的數據。舉例來說一個銷售快銷品的企業,能不能夠得到沃爾瑪的數據,家樂福的數據?很多國外大數據的案例,說消費者買啤酒的時候也會購買剃鬚刀之類,或者一個母嬰產品的消費者她今天在買這個產品,預示著她後面必然會買另一個產品。這就有一個前期的挖掘。這些價值怎麼來的,這就需要企業去找常規渠道里面的數據,跟自己的CRM結合起來,才能為自己下一步做市場營銷、做推廣、產品創新等建立基礎。

第四步,外部的社會化的或者非結構化的數據,即現在所謂的社會化媒體數據。這方面信息的主要特徵是非結構化,而且非常龐大。這對企業來說最大的價值是什麼?當你的用戶在社會化媒體上發言的時候,你有沒有跟他建立聯繫?

大數據華而不實麼?大數據的本質是什麼?

還有,大數據的核心在於大數據思維

網絡的誕生給世界帶來了大量的數據積累和信息流通,並帶來了一次“大數據思維”的思想變革。

機械思維時代,由於數據收集的侷限性,科學家們只能在有限的樣本下“大膽假設小心求證”,然而受限於人類大腦的“創造力”,所謂的“大膽假設”也並不是真的“大膽”;隨著互聯網時代的到來,“數據”不再成為問題,當大量數據堆積在一起時,就產生了“質”的變化。

互聯網時代的人們逐漸發現:** 世界其實是不確定的**,一方面世界的本質就是不確定的(比如原子核中的電子時刻都在做著無規則的運動);另一方面影響世界本身的變量太多,我們沒辦法用簡單的公式將他們全部囊括進來,只能儘可能的利用隨機事件來處理,利用概率來解釋。

與此同時,伴隨著數據的大量積累和統計數學的發展,人們驚喜的發現:在數據量達到一定程度的時候,數據和數據之間的關聯可以反映出某些意想不到的結果。於是大數據思維就誕生了:

世界本身是不確定的,利用大數據可以儘可能的消除這種不確定性,因果關係可以利用數據間的相關關係進行代替。

大數據思維,也有人將其成為“信息論”,其本質就是:

1)利用不確定性看待世界,然後利用大數據來儘可能的消除這種不確定性;2)利用具有多維度特徵的大數據,數據之間的相關關係來代替機械思維時代的因果關係,幫助我們在“創造”難以掌控的情況下,發現意想不到的結論。

舉例來說:

我們在投放廣告時,機械思維要我們先有一個假設:目標人群可能的特徵,並進行調研和證實;而大數據思維則是:我們不確定要投放給什麼樣的人群,緊接著我們利用已有用戶的數據特徵發現了“用戶群體畫像”這就是消除不確定性的過程,最終我們直接根據數據給出的結論來制定計劃。另外,我們利用機械思維制定投放廣告的策略時,會按照嚴謹的:“提出假設——實驗驗證——得出結論”的邏輯關係制定;但在大數據思維下,我們不需要知道“為什麼具有A特徵的用戶應該是我們投放廣告的目標人群”或“為什麼C平臺應該是我們選擇的投放渠道”,我們只需知道,“數據顯示A類人群購買此類產品最多”或“不同平臺中C類平臺的廣告產出比最高”僅此而已。這就是用“數據的相關性”取代“因果關係”。

大數據和小數據的區別,分析方法有何不同?

小數據分析方法,即傳統的數據分析,是指用適當的統計分析方法對收集來的大量數據進行分析,提取有用信息和形成結論而對數據加以詳細研究和概括總結的過程。

大數據的基本處理流程與傳統數據處理流程並無太大差異,主要區別在於:由於大數據要處理大量、非結構化的數據,所以在各處理環節中都可以採用並行處理。目前,Hadoop、MapReduce和Spark等分佈式處理方式已經成為大數據處理各環節的通用處理方法

"

大數據是否只是一個很空的概念和口號?若干年前就存在的東西,為什麼現在這麼火。現在是個人,言必稱大數據。大數據的本質是什麼?不要跟我說大數據只是“大”,它跟以往的小數據有什麼本質區別?分析方法上有什麼本質不同?

大數據華而不實麼?大數據的本質是什麼?

為什麼覺得大數據華而不實?

那是因為媒體、廠商對大數據的解讀,都在給人們造成一種認知偏差,認為“大數據能分析我們身邊的一切,大數據是萬能的,抓住大數據可以獲得財富”。

但其實這是一種言過其實的說法。只不過媒體需要吹捧新穎吸睛的概念;廠商需要誇大其應用市場、商業價值來吸引融資;企業需要將自己的改革和大數據掛鉤來確保成功的可能性,表明自己是在真創新。

大數據的應用和成功可能性還遠沒有這麼成熟。

大數據的本質是什麼?

現在叫大數據,以前可以稱為信息、情報等等名字。以前的信息蒐集技術沒有這樣發達,只能以樣本信息形式出現,而且由於結構類型不同,只能分類處理,有些數據還不便於儲存和比較。為什麼現在叫大數據,是因為現代互聯網技術,可以把不同結構類型的所有數據都能蒐集到,形成全數據,並且隨著大數據技術的深度發展,這些複雜結構類型的全數據,會被自動分類比較統計,所以稱為大數據。

大數據華而不實麼?大數據的本質是什麼?

吳軍在他的《智能時代》裡提到對於大數據的觀點:

只有量的積累的數據,通常並不能稱之為大數據。除了大量性,大數據常常還應該具有多維性和完備性。大數據的多維性,可以理解為針對單一“個體”(人/物/事件等)不同角度的數據。比如之前提到的:收集全國所有人的出生年月,單收集這一項,數據單一缺乏意義;但如果再加入收入、所屬地區、受教育程度等等多維的信息,那數據本身就變得鮮活了。我們可以從數據中分析人口的地域分佈、經濟分佈、教育分佈等並在此基礎上給出宏觀的資源調控計劃。大數據的完備性,則可以理解為數據的全面性。比如2012年一位名叫內德·斯威爾的年輕人,利用大數據成功預測了美國50+1個州的大選結果。他其實就是在投票前利用互聯網儘可能的蒐集當年的大選數據(如地方媒體數據、社交網絡留言、朋友間評論等),從而近似的知道每個人對大選的態度,並按照州進行分類整理,最終成功預測了當年的大選結果。缺少多維性的“大數據”會讓數據承載的信息“片面”,進而導致數據本身的利用價值大大下降;缺乏完備性的數據則會由於缺乏“完備樣本”的支撐,也會使得獲取的信息“侷限性”。大數據最好還應具有“及時性”,但及時性卻並不是其必備條件,只是有了“及時性”的大數據,會實現一些過去無法做到的事情。大數據的及時性,可以理解為數據收集的時效性。一方面,要分析當前情況,就要儘可能使用與當前時間點較為接近的數據;另一方面,數據本身就在時刻產生(特別是今天的互聯網),新鮮的數據能更快速的反應當前社會的一些情況。比如使用百度地圖導航的時候,它能根據數據庫中人們當前的(及時的數據)車輛出行地點,和即將要去的地方大概估算出此人的行程規劃,並通過眾多數據的整合估算出某一路段可能的堵塞情況,進而在導航的時候給出“避免擁堵”的導航建議。

由此可見,所謂的大數據,一定要同時滿足大量、多維和完備(相對來說)的特點,並在此基礎上,最好具有“時效性”。

參考自:讀大數據 《智能時代》有感

其次,大數據的意義在於驅動決策

大數據產生價值的鏈路是:數據驅動決策——決策實踐價值。

國內企業總是談數據變現實際是一種對大數據價值的歧義理解。企業面對的TO B或TO C不是個體單維度數據而是海量多維度數據,單一數據不能提供任何決策依據。然而企業決策者往往對大數據的理解不夠清晰透徹,片面的認為數據就是價值,花錢就要見效,把重點需求放在了所謂的上文說道的“有效數據上”當然效果在短期是非常顯而易見的。而在利益驅動下企業的方向就真的隨著“數據”驅動決策了,如同你是正常人卻天天吸純氧,企業想的就不是產品緊貼市場需求、如何有效改進,增強市場競爭優勢,而是圍繞相應“數據”下進行各種營銷。

第一步,找到核心數據。核心數據現在對很多企業來說實際上就是CRM,自己的用戶系統,這是最重要的。

第二步,外圍數據。比如企業經常會在線上線下舉辦一些活動,在做活動的時候,消費者的信息只是簡單地提供在表單裡面,還是進入了CRM的系統裡?

第三步,常規渠道的數據。舉例來說一個銷售快銷品的企業,能不能夠得到沃爾瑪的數據,家樂福的數據?很多國外大數據的案例,說消費者買啤酒的時候也會購買剃鬚刀之類,或者一個母嬰產品的消費者她今天在買這個產品,預示著她後面必然會買另一個產品。這就有一個前期的挖掘。這些價值怎麼來的,這就需要企業去找常規渠道里面的數據,跟自己的CRM結合起來,才能為自己下一步做市場營銷、做推廣、產品創新等建立基礎。

第四步,外部的社會化的或者非結構化的數據,即現在所謂的社會化媒體數據。這方面信息的主要特徵是非結構化,而且非常龐大。這對企業來說最大的價值是什麼?當你的用戶在社會化媒體上發言的時候,你有沒有跟他建立聯繫?

大數據華而不實麼?大數據的本質是什麼?

還有,大數據的核心在於大數據思維

網絡的誕生給世界帶來了大量的數據積累和信息流通,並帶來了一次“大數據思維”的思想變革。

機械思維時代,由於數據收集的侷限性,科學家們只能在有限的樣本下“大膽假設小心求證”,然而受限於人類大腦的“創造力”,所謂的“大膽假設”也並不是真的“大膽”;隨著互聯網時代的到來,“數據”不再成為問題,當大量數據堆積在一起時,就產生了“質”的變化。

互聯網時代的人們逐漸發現:** 世界其實是不確定的**,一方面世界的本質就是不確定的(比如原子核中的電子時刻都在做著無規則的運動);另一方面影響世界本身的變量太多,我們沒辦法用簡單的公式將他們全部囊括進來,只能儘可能的利用隨機事件來處理,利用概率來解釋。

與此同時,伴隨著數據的大量積累和統計數學的發展,人們驚喜的發現:在數據量達到一定程度的時候,數據和數據之間的關聯可以反映出某些意想不到的結果。於是大數據思維就誕生了:

世界本身是不確定的,利用大數據可以儘可能的消除這種不確定性,因果關係可以利用數據間的相關關係進行代替。

大數據思維,也有人將其成為“信息論”,其本質就是:

1)利用不確定性看待世界,然後利用大數據來儘可能的消除這種不確定性;2)利用具有多維度特徵的大數據,數據之間的相關關係來代替機械思維時代的因果關係,幫助我們在“創造”難以掌控的情況下,發現意想不到的結論。

舉例來說:

我們在投放廣告時,機械思維要我們先有一個假設:目標人群可能的特徵,並進行調研和證實;而大數據思維則是:我們不確定要投放給什麼樣的人群,緊接著我們利用已有用戶的數據特徵發現了“用戶群體畫像”這就是消除不確定性的過程,最終我們直接根據數據給出的結論來制定計劃。另外,我們利用機械思維制定投放廣告的策略時,會按照嚴謹的:“提出假設——實驗驗證——得出結論”的邏輯關係制定;但在大數據思維下,我們不需要知道“為什麼具有A特徵的用戶應該是我們投放廣告的目標人群”或“為什麼C平臺應該是我們選擇的投放渠道”,我們只需知道,“數據顯示A類人群購買此類產品最多”或“不同平臺中C類平臺的廣告產出比最高”僅此而已。這就是用“數據的相關性”取代“因果關係”。

大數據和小數據的區別,分析方法有何不同?

小數據分析方法,即傳統的數據分析,是指用適當的統計分析方法對收集來的大量數據進行分析,提取有用信息和形成結論而對數據加以詳細研究和概括總結的過程。

大數據的基本處理流程與傳統數據處理流程並無太大差異,主要區別在於:由於大數據要處理大量、非結構化的數據,所以在各處理環節中都可以採用並行處理。目前,Hadoop、MapReduce和Spark等分佈式處理方式已經成為大數據處理各環節的通用處理方法

大數據華而不實麼?大數據的本質是什麼?

上圖顯示了傳統的大數據工作流分析經歷的一些階段。數據以數據庫,數據流,數據集合以及數據倉庫等方式來建模。數據的數量級以及數據的多樣性要求在處理之前要進行數據的集成、清洗以及過濾等工作,以保證其後續工作的開展。

大數據學習資料獲取方式:

1、轉發文章

2、關注私信小編“大數據”

"

大數據是否只是一個很空的概念和口號?若干年前就存在的東西,為什麼現在這麼火。現在是個人,言必稱大數據。大數據的本質是什麼?不要跟我說大數據只是“大”,它跟以往的小數據有什麼本質區別?分析方法上有什麼本質不同?

大數據華而不實麼?大數據的本質是什麼?

為什麼覺得大數據華而不實?

那是因為媒體、廠商對大數據的解讀,都在給人們造成一種認知偏差,認為“大數據能分析我們身邊的一切,大數據是萬能的,抓住大數據可以獲得財富”。

但其實這是一種言過其實的說法。只不過媒體需要吹捧新穎吸睛的概念;廠商需要誇大其應用市場、商業價值來吸引融資;企業需要將自己的改革和大數據掛鉤來確保成功的可能性,表明自己是在真創新。

大數據的應用和成功可能性還遠沒有這麼成熟。

大數據的本質是什麼?

現在叫大數據,以前可以稱為信息、情報等等名字。以前的信息蒐集技術沒有這樣發達,只能以樣本信息形式出現,而且由於結構類型不同,只能分類處理,有些數據還不便於儲存和比較。為什麼現在叫大數據,是因為現代互聯網技術,可以把不同結構類型的所有數據都能蒐集到,形成全數據,並且隨著大數據技術的深度發展,這些複雜結構類型的全數據,會被自動分類比較統計,所以稱為大數據。

大數據華而不實麼?大數據的本質是什麼?

吳軍在他的《智能時代》裡提到對於大數據的觀點:

只有量的積累的數據,通常並不能稱之為大數據。除了大量性,大數據常常還應該具有多維性和完備性。大數據的多維性,可以理解為針對單一“個體”(人/物/事件等)不同角度的數據。比如之前提到的:收集全國所有人的出生年月,單收集這一項,數據單一缺乏意義;但如果再加入收入、所屬地區、受教育程度等等多維的信息,那數據本身就變得鮮活了。我們可以從數據中分析人口的地域分佈、經濟分佈、教育分佈等並在此基礎上給出宏觀的資源調控計劃。大數據的完備性,則可以理解為數據的全面性。比如2012年一位名叫內德·斯威爾的年輕人,利用大數據成功預測了美國50+1個州的大選結果。他其實就是在投票前利用互聯網儘可能的蒐集當年的大選數據(如地方媒體數據、社交網絡留言、朋友間評論等),從而近似的知道每個人對大選的態度,並按照州進行分類整理,最終成功預測了當年的大選結果。缺少多維性的“大數據”會讓數據承載的信息“片面”,進而導致數據本身的利用價值大大下降;缺乏完備性的數據則會由於缺乏“完備樣本”的支撐,也會使得獲取的信息“侷限性”。大數據最好還應具有“及時性”,但及時性卻並不是其必備條件,只是有了“及時性”的大數據,會實現一些過去無法做到的事情。大數據的及時性,可以理解為數據收集的時效性。一方面,要分析當前情況,就要儘可能使用與當前時間點較為接近的數據;另一方面,數據本身就在時刻產生(特別是今天的互聯網),新鮮的數據能更快速的反應當前社會的一些情況。比如使用百度地圖導航的時候,它能根據數據庫中人們當前的(及時的數據)車輛出行地點,和即將要去的地方大概估算出此人的行程規劃,並通過眾多數據的整合估算出某一路段可能的堵塞情況,進而在導航的時候給出“避免擁堵”的導航建議。

由此可見,所謂的大數據,一定要同時滿足大量、多維和完備(相對來說)的特點,並在此基礎上,最好具有“時效性”。

參考自:讀大數據 《智能時代》有感

其次,大數據的意義在於驅動決策

大數據產生價值的鏈路是:數據驅動決策——決策實踐價值。

國內企業總是談數據變現實際是一種對大數據價值的歧義理解。企業面對的TO B或TO C不是個體單維度數據而是海量多維度數據,單一數據不能提供任何決策依據。然而企業決策者往往對大數據的理解不夠清晰透徹,片面的認為數據就是價值,花錢就要見效,把重點需求放在了所謂的上文說道的“有效數據上”當然效果在短期是非常顯而易見的。而在利益驅動下企業的方向就真的隨著“數據”驅動決策了,如同你是正常人卻天天吸純氧,企業想的就不是產品緊貼市場需求、如何有效改進,增強市場競爭優勢,而是圍繞相應“數據”下進行各種營銷。

第一步,找到核心數據。核心數據現在對很多企業來說實際上就是CRM,自己的用戶系統,這是最重要的。

第二步,外圍數據。比如企業經常會在線上線下舉辦一些活動,在做活動的時候,消費者的信息只是簡單地提供在表單裡面,還是進入了CRM的系統裡?

第三步,常規渠道的數據。舉例來說一個銷售快銷品的企業,能不能夠得到沃爾瑪的數據,家樂福的數據?很多國外大數據的案例,說消費者買啤酒的時候也會購買剃鬚刀之類,或者一個母嬰產品的消費者她今天在買這個產品,預示著她後面必然會買另一個產品。這就有一個前期的挖掘。這些價值怎麼來的,這就需要企業去找常規渠道里面的數據,跟自己的CRM結合起來,才能為自己下一步做市場營銷、做推廣、產品創新等建立基礎。

第四步,外部的社會化的或者非結構化的數據,即現在所謂的社會化媒體數據。這方面信息的主要特徵是非結構化,而且非常龐大。這對企業來說最大的價值是什麼?當你的用戶在社會化媒體上發言的時候,你有沒有跟他建立聯繫?

大數據華而不實麼?大數據的本質是什麼?

還有,大數據的核心在於大數據思維

網絡的誕生給世界帶來了大量的數據積累和信息流通,並帶來了一次“大數據思維”的思想變革。

機械思維時代,由於數據收集的侷限性,科學家們只能在有限的樣本下“大膽假設小心求證”,然而受限於人類大腦的“創造力”,所謂的“大膽假設”也並不是真的“大膽”;隨著互聯網時代的到來,“數據”不再成為問題,當大量數據堆積在一起時,就產生了“質”的變化。

互聯網時代的人們逐漸發現:** 世界其實是不確定的**,一方面世界的本質就是不確定的(比如原子核中的電子時刻都在做著無規則的運動);另一方面影響世界本身的變量太多,我們沒辦法用簡單的公式將他們全部囊括進來,只能儘可能的利用隨機事件來處理,利用概率來解釋。

與此同時,伴隨著數據的大量積累和統計數學的發展,人們驚喜的發現:在數據量達到一定程度的時候,數據和數據之間的關聯可以反映出某些意想不到的結果。於是大數據思維就誕生了:

世界本身是不確定的,利用大數據可以儘可能的消除這種不確定性,因果關係可以利用數據間的相關關係進行代替。

大數據思維,也有人將其成為“信息論”,其本質就是:

1)利用不確定性看待世界,然後利用大數據來儘可能的消除這種不確定性;2)利用具有多維度特徵的大數據,數據之間的相關關係來代替機械思維時代的因果關係,幫助我們在“創造”難以掌控的情況下,發現意想不到的結論。

舉例來說:

我們在投放廣告時,機械思維要我們先有一個假設:目標人群可能的特徵,並進行調研和證實;而大數據思維則是:我們不確定要投放給什麼樣的人群,緊接著我們利用已有用戶的數據特徵發現了“用戶群體畫像”這就是消除不確定性的過程,最終我們直接根據數據給出的結論來制定計劃。另外,我們利用機械思維制定投放廣告的策略時,會按照嚴謹的:“提出假設——實驗驗證——得出結論”的邏輯關係制定;但在大數據思維下,我們不需要知道“為什麼具有A特徵的用戶應該是我們投放廣告的目標人群”或“為什麼C平臺應該是我們選擇的投放渠道”,我們只需知道,“數據顯示A類人群購買此類產品最多”或“不同平臺中C類平臺的廣告產出比最高”僅此而已。這就是用“數據的相關性”取代“因果關係”。

大數據和小數據的區別,分析方法有何不同?

小數據分析方法,即傳統的數據分析,是指用適當的統計分析方法對收集來的大量數據進行分析,提取有用信息和形成結論而對數據加以詳細研究和概括總結的過程。

大數據的基本處理流程與傳統數據處理流程並無太大差異,主要區別在於:由於大數據要處理大量、非結構化的數據,所以在各處理環節中都可以採用並行處理。目前,Hadoop、MapReduce和Spark等分佈式處理方式已經成為大數據處理各環節的通用處理方法

大數據華而不實麼?大數據的本質是什麼?

上圖顯示了傳統的大數據工作流分析經歷的一些階段。數據以數據庫,數據流,數據集合以及數據倉庫等方式來建模。數據的數量級以及數據的多樣性要求在處理之前要進行數據的集成、清洗以及過濾等工作,以保證其後續工作的開展。

大數據學習資料獲取方式:

1、轉發文章

2、關注私信小編“大數據”

大數據華而不實麼?大數據的本質是什麼?
"

大數據是否只是一個很空的概念和口號?若干年前就存在的東西,為什麼現在這麼火。現在是個人,言必稱大數據。大數據的本質是什麼?不要跟我說大數據只是“大”,它跟以往的小數據有什麼本質區別?分析方法上有什麼本質不同?

大數據華而不實麼?大數據的本質是什麼?

為什麼覺得大數據華而不實?

那是因為媒體、廠商對大數據的解讀,都在給人們造成一種認知偏差,認為“大數據能分析我們身邊的一切,大數據是萬能的,抓住大數據可以獲得財富”。

但其實這是一種言過其實的說法。只不過媒體需要吹捧新穎吸睛的概念;廠商需要誇大其應用市場、商業價值來吸引融資;企業需要將自己的改革和大數據掛鉤來確保成功的可能性,表明自己是在真創新。

大數據的應用和成功可能性還遠沒有這麼成熟。

大數據的本質是什麼?

現在叫大數據,以前可以稱為信息、情報等等名字。以前的信息蒐集技術沒有這樣發達,只能以樣本信息形式出現,而且由於結構類型不同,只能分類處理,有些數據還不便於儲存和比較。為什麼現在叫大數據,是因為現代互聯網技術,可以把不同結構類型的所有數據都能蒐集到,形成全數據,並且隨著大數據技術的深度發展,這些複雜結構類型的全數據,會被自動分類比較統計,所以稱為大數據。

大數據華而不實麼?大數據的本質是什麼?

吳軍在他的《智能時代》裡提到對於大數據的觀點:

只有量的積累的數據,通常並不能稱之為大數據。除了大量性,大數據常常還應該具有多維性和完備性。大數據的多維性,可以理解為針對單一“個體”(人/物/事件等)不同角度的數據。比如之前提到的:收集全國所有人的出生年月,單收集這一項,數據單一缺乏意義;但如果再加入收入、所屬地區、受教育程度等等多維的信息,那數據本身就變得鮮活了。我們可以從數據中分析人口的地域分佈、經濟分佈、教育分佈等並在此基礎上給出宏觀的資源調控計劃。大數據的完備性,則可以理解為數據的全面性。比如2012年一位名叫內德·斯威爾的年輕人,利用大數據成功預測了美國50+1個州的大選結果。他其實就是在投票前利用互聯網儘可能的蒐集當年的大選數據(如地方媒體數據、社交網絡留言、朋友間評論等),從而近似的知道每個人對大選的態度,並按照州進行分類整理,最終成功預測了當年的大選結果。缺少多維性的“大數據”會讓數據承載的信息“片面”,進而導致數據本身的利用價值大大下降;缺乏完備性的數據則會由於缺乏“完備樣本”的支撐,也會使得獲取的信息“侷限性”。大數據最好還應具有“及時性”,但及時性卻並不是其必備條件,只是有了“及時性”的大數據,會實現一些過去無法做到的事情。大數據的及時性,可以理解為數據收集的時效性。一方面,要分析當前情況,就要儘可能使用與當前時間點較為接近的數據;另一方面,數據本身就在時刻產生(特別是今天的互聯網),新鮮的數據能更快速的反應當前社會的一些情況。比如使用百度地圖導航的時候,它能根據數據庫中人們當前的(及時的數據)車輛出行地點,和即將要去的地方大概估算出此人的行程規劃,並通過眾多數據的整合估算出某一路段可能的堵塞情況,進而在導航的時候給出“避免擁堵”的導航建議。

由此可見,所謂的大數據,一定要同時滿足大量、多維和完備(相對來說)的特點,並在此基礎上,最好具有“時效性”。

參考自:讀大數據 《智能時代》有感

其次,大數據的意義在於驅動決策

大數據產生價值的鏈路是:數據驅動決策——決策實踐價值。

國內企業總是談數據變現實際是一種對大數據價值的歧義理解。企業面對的TO B或TO C不是個體單維度數據而是海量多維度數據,單一數據不能提供任何決策依據。然而企業決策者往往對大數據的理解不夠清晰透徹,片面的認為數據就是價值,花錢就要見效,把重點需求放在了所謂的上文說道的“有效數據上”當然效果在短期是非常顯而易見的。而在利益驅動下企業的方向就真的隨著“數據”驅動決策了,如同你是正常人卻天天吸純氧,企業想的就不是產品緊貼市場需求、如何有效改進,增強市場競爭優勢,而是圍繞相應“數據”下進行各種營銷。

第一步,找到核心數據。核心數據現在對很多企業來說實際上就是CRM,自己的用戶系統,這是最重要的。

第二步,外圍數據。比如企業經常會在線上線下舉辦一些活動,在做活動的時候,消費者的信息只是簡單地提供在表單裡面,還是進入了CRM的系統裡?

第三步,常規渠道的數據。舉例來說一個銷售快銷品的企業,能不能夠得到沃爾瑪的數據,家樂福的數據?很多國外大數據的案例,說消費者買啤酒的時候也會購買剃鬚刀之類,或者一個母嬰產品的消費者她今天在買這個產品,預示著她後面必然會買另一個產品。這就有一個前期的挖掘。這些價值怎麼來的,這就需要企業去找常規渠道里面的數據,跟自己的CRM結合起來,才能為自己下一步做市場營銷、做推廣、產品創新等建立基礎。

第四步,外部的社會化的或者非結構化的數據,即現在所謂的社會化媒體數據。這方面信息的主要特徵是非結構化,而且非常龐大。這對企業來說最大的價值是什麼?當你的用戶在社會化媒體上發言的時候,你有沒有跟他建立聯繫?

大數據華而不實麼?大數據的本質是什麼?

還有,大數據的核心在於大數據思維

網絡的誕生給世界帶來了大量的數據積累和信息流通,並帶來了一次“大數據思維”的思想變革。

機械思維時代,由於數據收集的侷限性,科學家們只能在有限的樣本下“大膽假設小心求證”,然而受限於人類大腦的“創造力”,所謂的“大膽假設”也並不是真的“大膽”;隨著互聯網時代的到來,“數據”不再成為問題,當大量數據堆積在一起時,就產生了“質”的變化。

互聯網時代的人們逐漸發現:** 世界其實是不確定的**,一方面世界的本質就是不確定的(比如原子核中的電子時刻都在做著無規則的運動);另一方面影響世界本身的變量太多,我們沒辦法用簡單的公式將他們全部囊括進來,只能儘可能的利用隨機事件來處理,利用概率來解釋。

與此同時,伴隨著數據的大量積累和統計數學的發展,人們驚喜的發現:在數據量達到一定程度的時候,數據和數據之間的關聯可以反映出某些意想不到的結果。於是大數據思維就誕生了:

世界本身是不確定的,利用大數據可以儘可能的消除這種不確定性,因果關係可以利用數據間的相關關係進行代替。

大數據思維,也有人將其成為“信息論”,其本質就是:

1)利用不確定性看待世界,然後利用大數據來儘可能的消除這種不確定性;2)利用具有多維度特徵的大數據,數據之間的相關關係來代替機械思維時代的因果關係,幫助我們在“創造”難以掌控的情況下,發現意想不到的結論。

舉例來說:

我們在投放廣告時,機械思維要我們先有一個假設:目標人群可能的特徵,並進行調研和證實;而大數據思維則是:我們不確定要投放給什麼樣的人群,緊接著我們利用已有用戶的數據特徵發現了“用戶群體畫像”這就是消除不確定性的過程,最終我們直接根據數據給出的結論來制定計劃。另外,我們利用機械思維制定投放廣告的策略時,會按照嚴謹的:“提出假設——實驗驗證——得出結論”的邏輯關係制定;但在大數據思維下,我們不需要知道“為什麼具有A特徵的用戶應該是我們投放廣告的目標人群”或“為什麼C平臺應該是我們選擇的投放渠道”,我們只需知道,“數據顯示A類人群購買此類產品最多”或“不同平臺中C類平臺的廣告產出比最高”僅此而已。這就是用“數據的相關性”取代“因果關係”。

大數據和小數據的區別,分析方法有何不同?

小數據分析方法,即傳統的數據分析,是指用適當的統計分析方法對收集來的大量數據進行分析,提取有用信息和形成結論而對數據加以詳細研究和概括總結的過程。

大數據的基本處理流程與傳統數據處理流程並無太大差異,主要區別在於:由於大數據要處理大量、非結構化的數據,所以在各處理環節中都可以採用並行處理。目前,Hadoop、MapReduce和Spark等分佈式處理方式已經成為大數據處理各環節的通用處理方法

大數據華而不實麼?大數據的本質是什麼?

上圖顯示了傳統的大數據工作流分析經歷的一些階段。數據以數據庫,數據流,數據集合以及數據倉庫等方式來建模。數據的數量級以及數據的多樣性要求在處理之前要進行數據的集成、清洗以及過濾等工作,以保證其後續工作的開展。

大數據學習資料獲取方式:

1、轉發文章

2、關注私信小編“大數據”

大數據華而不實麼?大數據的本質是什麼?
大數據華而不實麼?大數據的本質是什麼?
"

相關推薦

推薦中...