數(shù)據(jù)挖掘的主要任務(wù)
精選回答
相關(guān)剖析
兩個(gè)或兩個(gè)以上變量的取值之間存在某種規(guī)律性,就稱為相關(guān)。數(shù)據(jù)相關(guān)是數(shù)據(jù)庫中存在的一類重要的、可被發(fā)現(xiàn)的常識(shí)。相關(guān)分為簡略相關(guān)、時(shí)序相關(guān)和因果相關(guān)。相關(guān)剖析的目的是找出數(shù)據(jù)庫中隱藏的相關(guān)網(wǎng)。
聚類剖析
聚類是把數(shù)據(jù)依照類似性歸納成若干類別,同一類中的數(shù)據(jù)互相類似,不同類中的數(shù)據(jù)相異。聚類剖析能夠樹立宏觀的概念,發(fā)現(xiàn)數(shù)據(jù)的散布形式,以及可能的數(shù)據(jù)特點(diǎn)之間的相互聯(lián)系。
分類
分類便是找出一個(gè)類別的概念描繪,它代表了這類數(shù)據(jù)的整體信息,即該類的內(nèi)涵描繪,并用這種描繪來結(jié)構(gòu)模型,一般用規(guī)矩或決策樹形式表明。分類是使用訓(xùn)練數(shù)據(jù)集經(jīng)過必定的算法而求得分類規(guī)矩。分類可被用于規(guī)矩描繪和猜測。
猜測
猜測是使用歷史數(shù)據(jù)找出變化規(guī)律,樹立模型,并由此模型對未來數(shù)據(jù)的種類及特征進(jìn)行猜測。猜測關(guān)懷的是精度和不確定性,通常用猜測方差來衡量。
時(shí)序形式
時(shí)序形式是指經(jīng)過時(shí)刻序列搜索出的重復(fù)發(fā)生概率較高的形式。與回歸一樣,它也是用己知的數(shù)據(jù)猜測未來的值,但這些數(shù)據(jù)的區(qū)別是變量所處時(shí)刻的不同。
誤差剖析
在誤差中包括很多有用的常識(shí),數(shù)據(jù)庫中的數(shù)據(jù)存在很多異常情況,發(fā)現(xiàn)數(shù)據(jù)庫中數(shù)據(jù)存在的異常情況是非常重要的。誤差查驗(yàn)的根本方法便是尋覓觀察結(jié)果與參照之間的不同。
數(shù)據(jù)挖掘和數(shù)據(jù)分析的區(qū)別
數(shù)據(jù)分析更多采用統(tǒng)計(jì)學(xué)的知識(shí),對源數(shù)據(jù)進(jìn)行描述性和探索性分析,從結(jié)果中發(fā)現(xiàn)價(jià)值信息來評估和修正現(xiàn)狀。數(shù)據(jù)挖掘不僅僅用到統(tǒng)計(jì)學(xué)的知識(shí),還要用到機(jī)器學(xué)習(xí)的知識(shí),這里會(huì)涉及到模型的概念。數(shù)據(jù)挖掘具有更深的層次,來發(fā)現(xiàn)未知的規(guī)律和價(jià)值。
更多相關(guān)知識(shí)請點(diǎn)擊:
了解更多會(huì)計(jì)考試資訊,可以點(diǎn)擊查看東奧cma頻道。
免費(fèi)試聽 全部>>
-
CMA
現(xiàn)金管理
2023《P2》基礎(chǔ)班
免費(fèi)
已有2711人學(xué)習(xí) -
CMA
債券
2023《P2》基礎(chǔ)班
免費(fèi)
已有2729人學(xué)習(xí) -
CMA
責(zé)任中心
2023《P1》基礎(chǔ)班
免費(fèi)
已有2581人學(xué)習(xí)