【廣告】
1、傳統(tǒng)關(guān)系模型的擴(kuò)充
2、面向?qū)ο髷?shù)據(jù)模型
3、XML數(shù)據(jù)模型
4、發(fā)展出新的數(shù)據(jù)模型
空間數(shù)據(jù)模型是關(guān)于現(xiàn)實(shí)世界中空間實(shí)體及其相互間聯(lián)系的概念,它為描述空間數(shù)據(jù)的組織和設(shè)計(jì)空間數(shù)據(jù)庫(kù)模式提供著基本方法。因此,對(duì)空間數(shù)據(jù)模型的認(rèn)識(shí)和研究在設(shè)計(jì)GIS空間數(shù)據(jù)庫(kù)和發(fā)展新一代GIS系統(tǒng)的過(guò)程中起著舉足輕重的作用。
《地理信息系統(tǒng)——原理、方法和應(yīng)用》鄔倫等編著,第48頁(yè)。
來(lái)源二:為了能夠利用地理信息系統(tǒng)工具來(lái)解決現(xiàn)實(shí)世界中的問(wèn)題,首先必須將復(fù)雜的地理事物和現(xiàn)象抽象到計(jì)算機(jī)中進(jìn)行表示、處理和分析,其結(jié)果就是空間數(shù)據(jù)模型。
數(shù)據(jù)建模的具體過(guò)程可分為六大步驟:
一、制訂目標(biāo)
制訂目標(biāo)的前提是理解業(yè)務(wù),明確要解決的商業(yè)現(xiàn)實(shí)問(wèn)題是什么?
如:在社交平臺(tái)KOL中,存在假粉絲的情況,如何識(shí)別假粉就是一個(gè)要解決的現(xiàn)實(shí)問(wèn)題。
二、數(shù)據(jù)理解與準(zhǔn)備
基于要解決的現(xiàn)實(shí)問(wèn)題,理解和準(zhǔn)備數(shù)據(jù),一般需要解決以下問(wèn)題:
1.需要哪些數(shù)據(jù)指標(biāo)(即特征提?。浚ㄈ纾耗男┲笜?biāo)能區(qū)別真粉和假粉?)
2.數(shù)據(jù)指標(biāo)的含義是什么?
3.數(shù)據(jù)的質(zhì)量如何?(如:是否存在缺失值?)
4.數(shù)據(jù)能否滿足需求?
5.數(shù)據(jù)還需要如何加工?(如:轉(zhuǎn)換數(shù)據(jù)指標(biāo),將類(lèi)別型變量轉(zhuǎn)化為0-1啞變量,或?qū)⑦B續(xù)型數(shù)據(jù)轉(zhuǎn)化為有序變量)
6.探索數(shù)據(jù)中的規(guī)律和模式,進(jìn)而形成假設(shè)。
需要注意的是,數(shù)據(jù)準(zhǔn)備工作可能需要嘗試多次。因?yàn)樵趶?fù)雜的大型數(shù)據(jù)中,較難發(fā)現(xiàn)數(shù)據(jù)中存在的模式,初步形成的假設(shè)可能會(huì)被很快推到,這時(shí)一定要靜心鉆研,不斷試錯(cuò)。
數(shù)據(jù)建模后需要評(píng)估模型的效果,因此一般需要將數(shù)據(jù)分為訓(xùn)練集和測(cè)試集。