隨著時代進步和科技發(fā)展,大數(shù)據(jù)逐步為人類創(chuàng)造出更多的價值。你知道大數(shù)據(jù)的概念是什么嗎?它又有怎樣的特點呢?
大數(shù)據(jù)又稱巨量數(shù)據(jù)、海量數(shù)據(jù),是由數(shù)量巨大、結(jié)構(gòu)復(fù)雜、類型眾多的數(shù)據(jù)構(gòu)成的數(shù)據(jù)集合,基于云計算的數(shù)據(jù)處理與應(yīng)用模式,通過數(shù)據(jù)的集成共享,交叉復(fù)用形成的智力資源和知識服務(wù)能力。也有相關(guān)機構(gòu)對其有所定義:“大數(shù)據(jù)”是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。換言之,大數(shù)據(jù)就是在浩如煙海的信息中,利用數(shù)據(jù)分析的技術(shù),對冗雜無序的數(shù)據(jù)進行分析和整理,并迅速篩選出有價值的信息。
2010年10月,麥肯錫在《大數(shù)據(jù):創(chuàng)新競爭和提高生產(chǎn)率的下一個新領(lǐng)域》的研究報告里正式使用“大數(shù)據(jù)”一詞,并最早提出“大數(shù)據(jù)”時代已經(jīng)到來。簡單地說,“大數(shù)據(jù)”即“海量數(shù)據(jù)”+復(fù)雜類型的數(shù)據(jù),麥肯錫認(rèn)為大數(shù)據(jù)就是指無法在一定時間內(nèi)用傳統(tǒng)數(shù)據(jù)庫軟件工具對其內(nèi)容進行抓取、管理和處理的數(shù)據(jù)集合。大數(shù)據(jù)有4個方面的典型特征:數(shù)據(jù)體量巨大、數(shù)據(jù)類型繁多、價值密度低、處理速度快。
大數(shù)據(jù)可以將數(shù)據(jù)分析和整合的結(jié)果應(yīng)用于為企業(yè)提供決策支持,也可以將分析與建模的成果轉(zhuǎn)化為具體的應(yīng)用集成到業(yè)務(wù)流程中,為業(yè)務(wù)直接提供數(shù)據(jù)的支持。大數(shù)據(jù)的應(yīng)用一般分為兩類。一類是嵌入業(yè)務(wù)流程的數(shù)據(jù)輔助功能,如我們在網(wǎng)絡(luò)購物時,經(jīng)常會有“相關(guān)推薦”“猜你喜歡”等購物推薦,這就是通過數(shù)據(jù)分析與建模,分析我們的購物喜好,進行數(shù)據(jù)整合和篩選,最終得出推薦給我們的內(nèi)容。另一類則是以數(shù)據(jù)為驅(qū)動的業(yè)務(wù)場景,如我們在出行前進行相關(guān)準(zhǔn)備時,經(jīng)常會在網(wǎng)絡(luò)上對住宿,門票,車票等進行比價,這就是在采集各電商網(wǎng)站報價的基礎(chǔ)上,利用大數(shù)據(jù)對同一產(chǎn)品進行識別和排序,從而得到最優(yōu)方案。
提到大數(shù)據(jù)的發(fā)展,我們不得不提到一個概念——大數(shù)據(jù)的生命周期。事實上,它指的是某個集合的大數(shù)據(jù)從產(chǎn)生和獲取到銷毀的過程。也就是企業(yè)在實際運用大數(shù)據(jù)的過程中,在大數(shù)據(jù)戰(zhàn)略的基礎(chǔ)上,定義大數(shù)據(jù)范圍,確定大數(shù)據(jù)采集、存儲、整合、呈現(xiàn)與使用、分析與應(yīng)用、歸檔與銷毀的流程,并根據(jù)數(shù)據(jù)和應(yīng)用的狀況,對該流程進行持續(xù)優(yōu)化。
隨著移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、云計算技術(shù)的迅速發(fā)展,大數(shù)據(jù)技術(shù)也越來越受人們關(guān)注。