自古至今,從未有一個時代出現過如此大規模的數據爆炸。如今的商業世界,已經變成了飄浮在數據海洋上的巨輪,而那些通過大數據能力駛入藍海的企業,將會贏得豐厚的回報。
還記得10年之前風靡一時的美國情景喜劇《六人行》(又名《老友記》)嗎?在這部美國NBC電視臺從1994年開播到2004年落幕的經典之作中,6位主人公從姓名、職業到個人喜好至今都還能被粉絲們津津樂道。
這部美劇中有一個頗受觀注的傳奇謎團,那就是錢德勒到底是干什么的?——雖然他解釋過很多次自己的工作,但是從來沒有人真正弄明白過他所做的那個全稱叫做“an executive specializing in statistical analysis and data reconfiguration”是個什么東西。
在該劇熱播的10多年前,想要跟一個陌生人講清楚這樣一個與數據統計分析有關的崗位確實不是一件容易的事情,以至于到了《老友記》的最后兩季,“生不逢時”的錢德勒不得不轉行干起了廣告。不過到了今天,錢德勒們的職業卻正變得炙手可熱。
如今,在數字方面拿手,對于數據分析著迷不僅不會讓一個人再成為社會的另類,相反這意味著無數條件優厚的工作機會正在招手。
根據麥肯錫旗下研究部門麥肯錫全球學會(McKinsey Global Institute)2011年發布的一份報告顯示,預計美國需要14萬-19萬名擁有“深度分析”專長的工作者,以及150萬名更加精通數據的經理人,無論是已退休人士還是已受聘人士。
造成數據人才供不應求的一個顯著的背景就是如今“大數據”的爆發正在得到從企業界到政府層面越來越多的重視。
今年2月,《紐約時報》撰文稱,“大數據”正在對每個領域都造成影響,在商業、經濟和其他領域中,決策行為將日益基于數據分析做出,而不是像過去更多憑借經驗和直覺。而在公共衛生、經濟預測等領域,“大數據”的預見能力已經開始嶄露頭角。
一個最新的例子就是Facebook在5月18日的IPO。在5月18日之前,幾乎沒有人敢說自己有把握去預測Facebook上市當天股價的走勢,但是Twitter卻神奇般地做到了。
社交媒體監測平臺DataSift監測了Facebook IPO當天Twitter上的情感傾向與Facebook股價波動的關聯。例如,在Facebook開盤前Twitter上的情感逐漸轉向負面,25分鐘之后,Facebook的股價便開始下跌。而當Twitter上的情感轉向正面時,Facebook股價在8分鐘之后也開始了回彈。最終,當股市接近收盤時,Twitter上的情感轉向負面,10分鐘后Facebook的股價又開始下跌。最終的結論是:Twitter上每一次情感傾向的轉向都會影響Facebook股價的波動,延遲情況只有幾分鐘到20多分鐘。
這僅僅只是基于社交網絡產生的大數據進行“預見未來”的眾多案例之一,事實上“大數據”所能帶來的巨大商業價值已經被人認為將引領一場足以匹敵20世紀計算機革命的巨大變革。
2012年2月,《華爾街日報》發表文章《科技變革即將引領新的經濟繁榮》,文中罕見地做出大膽預見:“我們再次處于三場宏大技術變革的開端,他們可能足以匹敵20世紀的那場變革,這三場變革的震中都在美國,他們分別是大數據、智能制造和無線網絡革命。”
《華爾街日報》的斷言并非無的放矢。在今年年初的瑞士達沃斯論壇上,一份題為《大數據,大影響》(Big Data, Big Impact)的報告宣稱,數據已經成為一種新的經濟資產類別,就像貨幣或黃金一樣。
更加值得關注的則是,奧巴馬政府已經把“大數據”上升到了國家戰略的層面。根據美國白宮今年3月29日新聞,奧巴馬政府宣布投資2億美元啟動“大數據研究和發展計劃”。希望增強收集海量數據、分析萃取信息的能力。
上一次白宮親自參與推動信息技術產業的大手筆還是2010年希拉里提出的“國家寬帶戰略”,“大數據研究和發展計劃”也被認為是1993年時任美國副總統戈爾宣布的“信息高速公路”計劃后美國政府政策層面的一次“狂飆突進”,將“大數據”上升到國家意志將在下一個10年帶來深遠影響。
在互聯網和通信技術飛速發展20年后,一個屬于“大數據”的時代,真的來了。
數據海洋中的商業
商業的發展天生依賴數據來作出決策,但是自古至今,從未有一個時代出現過如此大規模的數據爆炸,如今的整個商業世界,已經變成了飄浮在數據海洋上的巨輪。
全球市值最大的連鎖餐飲企業麥當勞、零售業中的巨無霸沃爾瑪、在線零售的巨頭亞馬遜,這3家這個時代炙手可熱的企業,如果說他們之間存在著什么相關性的話,會是什么呢?
數據?沒錯。麥當勞的強大在于它賣的不僅僅是漢堡而是在從事一個精準選址,對數據深入挖掘的“房地產生意”;沃爾瑪的可怕在于其早在20世紀70年代末就開始通過挖掘數據來改善自己的供應鏈,時至今日,在其連鎖超市的表象之下早已成為一家巨大的數據公司;亞馬遜就更不用說了,貝索斯從不掩飾他對于數據中心的看重,對于這家電商巨頭來說,數據就意味著一切。
以沃爾瑪為例。早在1969年沃爾瑪就開始使用計算機來跟蹤存貨,1974年就將其分銷中心與各家商場運用計算機進行庫存控制。1983年,沃爾瑪所有門店都開始采用條形碼掃描系統。1987年,沃爾瑪完成了公司內部的衛星系統的安裝,該系統使得總部,分銷中心和各個商場之間可以實現實時,雙向的數據和聲音傳輸。
采用這些在當時還是小眾和超前的信息技術來搜集運營數據為沃爾瑪最近20年的崛起打下了堅實的地基。如今,沃爾瑪擁有著全世界最大的數據倉庫,在數據倉庫中存儲著沃爾瑪數千家連鎖店在65周內每一筆銷售的詳細記錄,這使得業務人員可以通過分析購買行為更加了解他們的客戶。
國外零售巨頭對于數據資產的重視也在近年來影響著國內的電商企業。凡客誠品CEO陳年對《商業價值》雜志記者表示,“現在的凡客是一家數據公司。”
2011年凡客內部最大且最重要的一次調整就是想要實現互聯網的系統化和數字化的管理,為了讓任何“數字”變得可預測和可控,凡客成立了數據中心。
一開始,大家對數據中心的需求就是得到一些簡單的數據,比如庫存的數量。但是他們慢慢發現,得到數據之后就會面臨一些相關的問題,如怎么配合進貨等,于是數據中心就開始根據不同的問題,不斷尋找數據與數據之間關聯,并最終把各種關系搭建起來。出現庫存周轉慢的問題怎么辦呢?數據中心就又得分析與庫存相關的數據關系。除此之外,數據中心還會去研究新產品的上架與新用戶增長的關系,每上線一個新品與它能夠帶來的用戶二次購買的關系等。
電商行業的現金收入源自數據,而婚戀網站的商業模型更是根植于對數據的研究。
比如,作為一家婚戀網站,百合網不僅需要經常做一些研究報告,分析注冊用戶的年齡、地域、學歷、經濟收入等數據,即便是每名注冊用戶小小的頭像照片,這背后也大有挖掘的價值。
百合網研究規劃部李琦曾經對百合網上海量注冊用戶的頭像信息進行分析,發現那些受歡迎頭像照片不僅與照片主人的長相有關,同時照片上人物的表情、臉部比例、清晰度等因素也在很大程度上決定了照片主人受歡迎的程度。
例如,對于女性會員,微笑的表情、直視前方的眼神和淡淡的妝容能增加自己受歡迎的概率,而那些臉部比例占照片1/2、穿著正式、眼神直視沒有多余pose的男性則更可能成為婚戀網站上的寵兒。
當然,視數據為生命的不僅限于這些每天產生海量數據的零售和互聯網行業,即便是在看上去不那么“理性”的運動產業,數據依然是至關重要的寶藏。
好的運動鞋最關鍵要做到的是什么?更好的材料?更輕便的鞋身?更酷的款式?都不是,衡量一雙運動鞋好壞的重要標準就是在于它是否更了解消費者的雙腳。正因如此,早在20世紀七八十年代耐克和阿迪達斯就紛紛建立了自己的運動實驗室,用來搜集并研究用戶的雙腳。其中最有名的就是Nike的“運動廚房”(Nike Kitchen),Nike現在所有知名的技術產品都出自于這里。
Nike近兩年十分火爆的Nike ID業務就是充分挖掘數據潛力的例子。Nike ID業務是允許消費者基于耐克的一些已有產品進行個性化的改造,消費者可以在線上對產品進行改造,選擇自己喜歡的顏色搭配、面料,甚至繡上自己的名字縮寫等,完成自己的設計后,Nike就能為消費者量身打造一款獨一無二的運動鞋。通過Nike ID業務,Nike公司不僅能夠了解到用戶的喜好,同時這些寶貴的數據對于Nike將來研發新品都是非常重要的參考。
從數據到大數據
人類自從誕生以來就在源源不斷地創造著數據,商業文明的發展自始至終都離不開對于數據寶藏的挖掘,在商業世界中,數據一直都不是什么新鮮的東西,但是當海量的數據積累所造就的“大數據”時代到來,經濟的新的增量已經逐漸露出了面紗。
盡管數據挖掘的工作人類已經做了幾十年,但是“大數據”與我們通常所說的“數據”還是有顯著的不同。
1997年,一臺名叫“深藍”的計算機擊敗了當時的國際象棋冠軍Garry Kasparov。2011年,另一臺計算機Watson在廣受歡迎的美國電視智力競賽節目《Jeopardy!》再次戰勝前幾屆的冠軍。
這兩件事很好地詮釋了數據與大數據這兩個不同的商業時代。誕生于數據時代的深藍,通過將象棋的游戲規則轉化為以0和1形式存在的算法,借助全新并行處理技術,計算可能的走棋結果,如今,幾乎任何一臺計算機都能夠通過掃描數據庫而將結構化查詢與答案匹配起來。而在大數據相關技術的幫助下,Watson則能夠回答那些以人類說話方式提出的不可預測的問題,Watson 能夠“讀取”大量人類知識載體,包括百科全書、報告、報紙、書籍等。它以分析形式評估證據,假設應答結果,并計算每種可能性的可信度。它在數秒內提供一個最有可能正確的答案。另外,它在做這些工作時,速度和準確性都超過世界一流的人類對手。
大數據的迅速增長及相關技術的發展正在帶來全新的商業機遇。據《麻省理工學院斯隆管理評論》和IBM商業價值研究院聯合舉行的2011年新智能企業全球高管調查和研究項目指出,絕大多數企業都已抓住了這些機遇。2011年,58%的企業已經將分析技術用于在市場或行業內創造競爭優勢,而2010年這一比例僅為37%。值得注意的是,采用分析技術的企業持續超越同行的可能性要高兩倍。
對于任何企業來說,數據都是其商業皇冠上最為耀眼奪目的那顆寶石。伴隨著傳統的商業智能系統向縱深應用的拓展,商業決策已經越來越依賴于數據。然而,傳統的商業智能系統中用以分析的數據,大都是企業自身信息系統中產生的運營數據,這些數據大都是標準化、結構化的。事實上,這些數據只占到了企業所能獲取的數據中很小的一部分——不到15%。
通常情況下,企業的數據可以分為3種類型:結構化數據、半結構化數據和非結構化數據。其中,85%的數據屬于廣泛存在于社交網絡、物聯網、電子商務等之中的非結構化數據。這些非結構化數據的產生往往伴隨著社交網絡、移動計算和傳感器等新的渠道和技術的不斷涌現和應用。企業用以分析的數據越全面,分析的結果就越接近于真實。大數據分析意味著企業能夠從這些新的數據中獲取新的洞察力,并將其與已知業務的各個細節相融合。
在沃爾沃集團,通過在卡車產品中安裝傳感器和嵌入式CPU,從剎車到中央門鎖系統等形形色色的車輛使用信息,正源源不斷地傳輸到沃爾沃集團總部。“對這些數據進行分析,不僅可以幫助我們制造更好的汽車,還可以幫助客戶們獲取更好體驗。”沃爾沃集團CIO Rich Strader說。
現在,這些數據正在被用來優化生產流程,以提升客戶體驗和提升安全性。將來自不同客戶的使用數據進行分析,可以讓產品部門提早發現產品潛在的問題,并在這些問題發生之前提前向客戶預警。“產品設計方面的缺陷,此前可能需要有50萬臺銷量的時候才能暴露出來,而現在只需要1000臺,我們就能發現潛在的缺陷。” Rich Strader說。
在美國最大的醫藥貿易商McKesson公司,對大數據的應用也已經遠遠領先于大多數企業,將先進的分析能力融合到每天處理200萬個訂單的供應鏈業務中,并且監督超過80億美元的存貨。
對于在途存貨的管理,McKesson開發了一種供應鏈模型,它根據產品線、運輸費用甚至碳排放量而提供了極為準確的維護成本視圖。據公司流程改造副總裁Robert Gooby說,這些詳細信息使公司能夠更加真實地了解任意時間點的運營情況。
Gooby解釋說:“但是,大多數模型旨在簡化物理世界,而這個模型極為復雜,并且包含我們的現實世界的全部數據。它允許我們量化業務運作的根本性變化所產生的影響的細節。這個模型并不是一種簡化版。”
McKesson利用先進分析技術的另一個領域是對配送中心內的物理存貨配置進行模擬和自動化處理。評估政策和供應鏈變化的能力幫助公司增強了對客戶的響應能力,同時減少了流動資金。總體來講,McKesson的供應鏈轉型使公司節省了超過1億美元的流動資金。
同樣對大數據情有獨鐘的,還有中國移動集團山西有限公司,通過大數據分析,對企業運營的全業務進行針對性的監控、預警、跟蹤。系統在第一時間自動捕捉市場變化,再以最快捷的方式推送給指定負責人,使他在最短時間內獲知市場行情。
“全面獲取業務信息非常重要,有時候甚至能顛覆常規分析思路下做出的結論。” 中國移動集團山西有限公司業務支撐系統部經理王峰說。比如,一個客戶使用最新款的諾基亞手機,每月準時繳費、平均一年致電客服3次,使用WEP和彩信業務。如果按照傳統的數據分析,可能這是一位客戶滿意度非常高、流失概率非常低的客戶。事實上,當搜集了包括微博、社交網絡等新型來源的客戶數據之后,這位客戶的真實情況可能是這樣的:客戶在國外購買的這款手機,手機中的部分功能在國內無法使用,在某個固定地點手機經常斷線,彩信無法使用——他的使用體驗極差,正在面臨流失風險。
“我們正在打破傳統數據源的邊界,更加注重社交媒體等新型數據來源。通過各種渠道獲取盡可能多的客戶反饋信息,并從這些數據中挖掘更多的價值。”王峰說。
社交網絡、移動互聯網、企業信息化在最近這幾年中都得到了迅猛的發展,不斷產生的海量數據將越來越影響企業從戰術到戰略制定的各個方面,這是一個巨大的挑戰,當然更是機遇,因為在大數據的背后,將是IT廠商跨越到商業智能的絕佳機會。
IBM當年之所以完成從PC廠商開始向商業智能服務商的成功轉型,一個重要的原因就是其較早預見到了大數據的商業機遇并果斷布局。縱觀IBM近5年10億美元以上級別的大手筆收購多與如何有效處理大數據有關。2007年,IBM花費20億美元收購了商務智能軟件供應商Congnos;2009年7月,IBM斥資12億美元收購SPSS軟件,這是一家集數據整理、分析功能于一身的統計分析軟件;2010年9月,IBM以17億美元的代價將數據庫分析供應商Netezza收之麾下——自2005年以來,IBM投資160億美元進行了30次與大數據有關的收購。這一系列布局,為IBM業績帶來了穩定高速的增長。2012年,IBM股價突破200美元大關,累計漲幅超過9%,3年之內股價翻了3倍。
同樣在搶占大數據蛋糕份額時占據先機的還有甲骨文。面對越來越多的海量數據所帶來的商業潛力,甲骨文的策略是在2011年的OpenWorld大會上推出了Oracle大數據機和Exalytics商務智能服務器,構建自己的大數據平臺解決方案。除此之外,早在2008年,甲骨文就花費33億美元收購商業智能解決方案提供商海波龍(Hyperion),2009年以74億美元巨資鯨吞另一家IT巨頭SUN公司。
而在大數據實時分析的領域中,SAP也不甘人后。2011年SAP推出了HANA平臺以應對大數據實時分析的挑戰。和IBM、甲骨文這些對手一樣,SAP也一直沒有停止通過大手筆的收購在大數據領域進行戰略布局。2007年,SAP花費68億美元收購全球商業智能軟件霸主Business Object,2010年5月,SAP以58億美元的代價并購數據庫廠商Sybase。圍繞著大數據的這些大手筆的戰略布局也讓SAP收到了回報,2011年,SAP全年利潤翻番,達到34億歐元,造就了該公司40年歷史上最好的業績。
此外,EMC、Informatica、Taredata等公司,也都是大數據領域不可忽略的勢力。
正在異化的核心競爭力
大數據時代,一些傳統的商業思想正在被顛覆。這其中最為重要的,就是必須將數據作為企業的核心資產。
在進入大數據時代之前的漫長的商業社會進化過程中,企業脫離于人才而單獨存在的智商基本是零,也正因為如此,人才變得異常重要,并一度被視為企業的核心競爭力—— 一方面,企業的智商被分布存儲在這些人才的大腦中;另一方面,企業需要借助人才的商業智商,提升自身的企業智商。一定程度上,企業智商的高低,完全取決于人才的商業智商。
與此同時,由于企業智商被分布存儲于人才的大腦中,信息的分享與價值挖掘受到極大制約,很難完全發揮。
在大數據時代,人才固然重要,卻并非企業智商最重要的載體——數據才是企業智商真正的核心載體。這些能夠被企業隨時獲取的數據,可以幫助和指導企業全業務流程的任何一個環節進行有效運營和優化,并幫助企業做出最明智的決策。在大數據時代的企業智商,才是真正被企業全部掌控的智商,而這一切的基礎就是形形色色的數據。
IDC在其關于大數據的報告中指出,領軍企業與其他企業之間最大的差別在于新數據類型的引入。那些沒有引入新的分析技術和新的數據類型的企業,不太可能成為其行業的領軍者。
在大數據時代,商業世界就如同飄浮在數據海洋上的巨輪,作為商業世界中的個體,企業要想做到游刃有余就必須如熟悉水性一般熟悉和用好海量的數據。大數據在重新定義企業智商的同時,對企業核心資產也進行了重塑。在過去,衡量企業最重要的資產無外乎土地、流動資金和人才等幾個要素,如今,數據作為企業一項更加重要的資產將直接關系到企業的發展潛力。
在完成對企業智商和核心資產的重塑之后,數據資產正在當仁不讓地成為現代商業社會的核心競爭力。與其他行業相比,互聯網行業已經提早感受到了大數據對商業帶來的深切變化。當很多企業還在因為大數據對商業世界的變革無所適從時,一些互聯網企業已經完成了核心競爭力的重新定義,正在這些互聯網企業身上發生的變化,一定程度上恰恰是其他企業在大數據時代的未來。
“5年前我們就建立了大數據分析平臺。在這個平臺上,可以將結構化數據和非結構化數據結合在一起,通過分析促進eBay的業務創新和利潤增長。”eBay分析平臺高級總監Oliver Ratzesberger告訴《商業價值》記者。
現在,eBay的分析平臺每天處理的數據量高達100PB,超過了納斯達克交易所每天的數據處理量。為了準確分析用戶的購物行為,eBay定義了超過500種類型的數據,對顧客的行為進行跟蹤分析。
在早期,eBay網頁上的每一個功能的更改,通常由對該功能非常了解的產品經理決定,判斷的依據主要是產品經理的個人經驗。而通過對用戶行為數據的分析,網頁上任何功能的修改都交由用戶去決定。“每當有一個不錯的創意或者點子,我們都會在網站上選定一定范圍的用戶進行測試。通過對這些用戶的行為分析,來看這個創意是否帶來了預期的效果。” Oliver Ratzesberger說。
更顯著的變化反應在廣告費上。eBay對互聯網廣告的投入一直很大,通過購買一些網頁搜索的關鍵字,將潛在客戶引入eBay網站。為了對這些關鍵字廣告的投入產出進行衡量,eBay建立了一個完全封閉式的優化系統。通過這個系統,可以精確計算出每一個關鍵字為eBay帶來的投資回報。通過對廣告投放的優化,自2007年以來,eBay產品銷售的廣告費降低了99%,頂級賣家占總銷售額的百分比卻上升至32%。
另一家電子商務巨頭亞馬遜也提早進入了大數據時代,亞馬遜CTO Werner Vogels在Cebit上關于大數據的演講,向與會者描述了亞馬遜在大數據時代的商業藍圖。長期以來,亞馬遜一直通過大數據分析,嘗試定位客戶和和獲取客戶反饋。“在此過程中,你會發現數據越大,結果越好。為什么有的企業在商業上不斷犯錯?那是因為他們沒有足夠的數據對運營和決策提供支持。” Vogels說,“一旦進入大數據的世界,企業的手中將握有無限可能。”
國金證券在其發布的大數據系列報告中提出了大數據時代應用軟件互聯網化,行業應用垂直整合和數據成為核心資產等3個主要的趨勢,其中最為值得注意的就是在傳統操作系統,數據庫平臺軟件同質化趨勢日趨明顯的背景下,未來越靠近最終用戶的企業將在產業鏈中擁有更大的發言權。而且企業如何通過抓住用戶獲取源源不斷的數據資產將會是一個新的兵家必爭之地。
人們對于數據資產的迷戀體現在方方面面。例如,誠實地說,除了目前還不能算是十分完善的廣告系統之外,Facebook在商業模式的探索上并不成熟,但這并不妨礙它獲得超過1000億美元的估值。盡管短期來看Facebook的股價會有較大波動,但是更多人還是相信其長期利好,其中一個重要的原因就是Facebook手中掌握著8.5億用戶每天產生的海量數據,這些數據早晚會通過一個恰當的方式釋放出商業價值,不斷產生的數據本身就是Facebook最重要的資產。
而奧巴馬政府對于大數據的看法則從一個側面凸顯了數據在今天的重要程度。
今年3月22日,奧巴馬宣布以2億美元投資大數據領域,在次日的電話會議上,美國政府將數據定義為“未來的新石油”,美國政府認識到了一個國家擁有數據的規模,活性及解釋運用的能力將成為綜合國力的重要組成部分,未來對數據的占有和控制甚至將成為繼陸權、海權、空權之外另一個國家核心資產。國家如此,作為天生需要靠數據驅動財務增長的企業來說更是如此。
商業的發展歷史并不是一個存在于人們頭腦中虛無縹緲的概念,相反,它是一個不斷演變和進化的生態系統。縱觀歷史上和現在的那些百年企業,他們的共同特點就是在于面對持續發生變化的商業環境,他們在成長的過程中比其他企業擁有更為強大的進化能力,能夠及時調整自己的戰略布局以適應不斷變化著的商業生態。
例如,100年前,諾基亞還是一家芬蘭的木漿造紙和橡膠生產公司,20世紀60年代開始,它抓住了全球電信行業發展的機遇,從生產電纜到經營電信網絡再到制造手機終端,隨著商業生態的變化不斷地進化,在移動互聯網到來嚴重沖擊其手機業務的情況下,諾基亞再次開始了其向智能終端的進化和轉型。
又如,20世紀60-80年代,IBM還是全球最大的個人電腦公司之一,但是進入新世紀之后個人電腦的利潤越來越微薄,IBM開始果斷出售自己的PC業務,開始向解決方案提供商轉化,作為一家員工過萬的超大型企業,IBM涅 重生的關鍵就在于其善于審時度勢,持續不斷地進化能力。
今天的大數據時代,讓商業的生態環境在不經意間發生了巨大的變化:網民和消費者的界限正在變得模糊,無處不在的智能終端,隨時在線的網絡傳輸,互動頻繁的社交網絡讓以往只是網頁瀏覽者的網民的面孔從模糊變得清晰,對于企業來說,他們第一次有機會進行大規模的精準化的消費者行為研究;作為保持著持續變革欲望的企業,主動地擁抱這種變化,從戰略到戰術層面開始自我的蛻變和進化將會讓他們更加適應這個新的時代。
大數據的特點
對于大數據的特點,業界通常用Volume、Variety、Value、Velocity這4個V來概括。大數據的特點包括:第一,數據體量巨大。從TB級別躍升到PB乃至EB級別。要知道目前的數據量有多大,我們先來看看一組公式。1024GB=1TB;1024TB=1PB;1024PB=1EB;1024 EB=1ZB;1024ZB=YB。到目前為止,人類生產的所有印刷材料的數據量是200PB,而歷史上全人類說過的所有的話的數據量大約是5EB。
第二,數據類型繁多。這種類型的多樣性也讓數據被分為結構化數據和非結構化數據。相對于以往便于存儲的以文本為主的結構化數據,越來越多的非結構化數據的產生給所有廠商都提出了挑戰。拜互聯網和通信技術近年來迅猛發展所賜,如今的數據類型早已不是單一的文本形式,除了網絡日志、音頻、視頻、圖片、地理位置信息等等多類型的數據對數據的處理能力提出了更高的要求。
第三,價值密度低。價值密度的高低與數據總量的大小成反比。以視頻為例,一部一小時的視頻,在連續不間斷監控過程中,可能有用的數據僅僅只有一兩秒。如何通過強大的機器算法更迅速地完成數據的價值“提純”是目前大數據洶涌背景下亟待解決的難題。
第四,處理速度快。這是大數據區分于傳統數據挖掘最顯著的特征。根據IDC的一份名為“數字宇宙”的報告,預計到2020年全球數據使用量將會達到35.2ZB。在如此海量的數據面前,處理數據的效率就是企業的生命。
更多文章、技術交流、商務合作、聯系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
