大數(shù)據(jù)是什么
精選回答
大數(shù)據(jù)是指無(wú)法在一定時(shí)間內(nèi)用常規(guī)軟件工具對(duì)其內(nèi)容進(jìn)行抓取、管理和處理的數(shù)據(jù)集合。大數(shù)據(jù)有五大特點(diǎn),即大量、高速、多樣、低價(jià)值密度、真實(shí)性。它并沒(méi)有統(tǒng)計(jì)學(xué)的抽樣方法,只是觀察和追蹤發(fā)生的事情。大數(shù)據(jù)的用法傾向于預(yù)測(cè)分析、用戶行為分析或某些其他高級(jí)數(shù)據(jù)分析方法的使用。
大數(shù)據(jù)的特征
1.數(shù)據(jù)量大(Volume):大數(shù)據(jù)的起始計(jì)量單位是PB(1024TB)、EB(1024PB,約100萬(wàn)TB)或ZB(1024EB,約10億TB),未來(lái)甚至?xí)_(dá)到Y(jié)B(1024ZB)或BB(1024YB)。
2.數(shù)據(jù)多樣性(Variety):大數(shù)據(jù)類型繁多,包括網(wǎng)絡(luò)日志、音頻、視頻、圖片、地理位置等各種結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)。結(jié)構(gòu)化數(shù)據(jù)是指存儲(chǔ)在數(shù)據(jù)庫(kù)里,可以用二維表結(jié)構(gòu)實(shí)現(xiàn)表達(dá)的數(shù)據(jù);非結(jié)構(gòu)化數(shù)據(jù)是指數(shù)據(jù)結(jié)構(gòu)不規(guī)則或不完整,沒(méi)有預(yù)定義的數(shù)據(jù),包括所有格式的辦公文檔、文本、圖片、報(bào)表、圖像、音頻信息、視頻信息等;半結(jié)構(gòu)化數(shù)據(jù)是介于完全結(jié)構(gòu)化數(shù)據(jù)和完全非結(jié)構(gòu)化數(shù)據(jù)之間的數(shù)據(jù),具有一定的結(jié)構(gòu)性,例如員工簡(jiǎn)歷,有的簡(jiǎn)歷只有教育情況,有的簡(jiǎn)歷包括教育、婚姻、戶籍、出入境等很多信息。
3.價(jià)值密度低(Value):大數(shù)據(jù)價(jià)值密度的高低與數(shù)據(jù)總量的大小成反比。以視頻為例,在連續(xù)不間斷的監(jiān)控中,有用數(shù)據(jù)可能僅有一兩秒。原始零散、復(fù)雜多樣,甚至可能有數(shù)據(jù)噪聲和污染的數(shù)據(jù)需要經(jīng)歷價(jià)值“提純”才能得出信息、獲取知識(shí)。
4.數(shù)據(jù)的產(chǎn)生和處理速度快(Velocity):大數(shù)據(jù)的智能化和實(shí)時(shí)性要求越來(lái)越高,對(duì)處理速度也有極嚴(yán)格的要求,一般要在秒級(jí)時(shí)間范圍內(nèi)給出分析結(jié)果,超出這個(gè)時(shí)間數(shù)據(jù)就可能失去價(jià)值,即大數(shù)據(jù)的處理要符合“1秒定律”。
更多相關(guān)知識(shí)請(qǐng)點(diǎn)擊:
了解更多會(huì)計(jì)考試資訊,可以點(diǎn)擊查看東奧cma頻道。
免費(fèi)試聽 全部>>
-
CMA
現(xiàn)金管理
2023《P2》基礎(chǔ)班
免費(fèi)
已有2711人學(xué)習(xí) -
CMA
債券
2023《P2》基礎(chǔ)班
免費(fèi)
已有2729人學(xué)習(xí) -
CMA
責(zé)任中心
2023《P1》基礎(chǔ)班
免費(fèi)
已有2581人學(xué)習(xí)