【廣告】
時序數(shù)據(jù)
時序數(shù)據(jù)就是時間序列數(shù)據(jù),即某個指標(biāo)根據(jù)時間順序記載的數(shù)據(jù)序列。在以時間為橫軸的坐標(biāo)系中將時序數(shù)據(jù)值連成線,可將歷史時序數(shù)據(jù)做成多維度表,發(fā)現(xiàn)其規(guī)律和異常,也可將時序數(shù)據(jù)用于大數(shù)據(jù)分析,實現(xiàn)趨勢預(yù)測和異常預(yù)警。
工業(yè)互聯(lián)網(wǎng)環(huán)境下需采集的工業(yè)時序數(shù)據(jù)量巨大,且具有如下典型特征:數(shù)據(jù)都是結(jié)構(gòu)化的;一個采集點的數(shù)據(jù)源是一個;數(shù)據(jù)較少有更新或刪除操作,一般按到期日期來刪除;數(shù)據(jù)以寫操作為主,讀操作為輔;數(shù)據(jù)流量平穩(wěn),可較為準(zhǔn)確地計算;數(shù)據(jù)都有統(tǒng)計、聚合等實時計算操作;數(shù)據(jù)根據(jù)規(guī)定的時間段和區(qū)域進(jìn)行查找。
時序數(shù)據(jù)與關(guān)系型數(shù)據(jù)的差異
(1)較明顯的特征是時序數(shù)據(jù)都存在僅有的時間戳,并且以時間戳大小進(jìn)行排序,以時間戳作為僅有標(biāo)識進(jìn)行區(qū)分,而關(guān)系型數(shù)據(jù)通常有其他字段作為標(biāo)識,比如學(xué)生的數(shù)據(jù)通常使用學(xué)號作為僅有標(biāo)識進(jìn)行區(qū)分。
(2)時序數(shù)據(jù)并不關(guān)心關(guān)系,在汽車定位中,我們不需要了解這輛汽車的所有者的其他屬性,例如年齡、職業(yè)等等,也就不存在對汽車所有者的表的關(guān)聯(lián)。
(3)時序數(shù)據(jù)的數(shù)據(jù)量持續(xù)呈線性增長,每隔一定時間粒度就會產(chǎn)生新的數(shù)據(jù),將會持續(xù)產(chǎn)生海量數(shù)據(jù),因此數(shù)據(jù)量龐大。而關(guān)系型數(shù)據(jù)的增長通常不是隨著時間持續(xù)增長的,比如一所學(xué)校的學(xué)生的據(jù)量在一段時間內(nèi)都是相對穩(wěn)定的。
(4)時序數(shù)據(jù)很少會有更新操作,在某個時刻的測量值產(chǎn)生將不會發(fā)生變化,所以幾乎不需要對時序數(shù)據(jù)進(jìn)行更新。對于關(guān)系型數(shù)據(jù),則是已存在的數(shù)據(jù)經(jīng)常發(fā)生更新,比如學(xué)生的個人信息,包括年齡、身高等屬性。
時序數(shù)據(jù)庫的特點介紹
快速的時間窗口查詢能力。時序業(yè)務(wù)的查詢需求分為兩類,一是實時數(shù)據(jù)查詢,反映當(dāng)前監(jiān)控對象的狀態(tài);二是主要是查詢某個時間段的歷史數(shù)據(jù),歷史數(shù)據(jù)的數(shù)據(jù)量非常大,這時候需要針對時間窗口大量數(shù)據(jù)查詢進(jìn)行優(yōu)化。
快速的聚合能力。時序業(yè)務(wù)場景通常會關(guān)心數(shù)據(jù)的聚合值,比如 count、mean 等聚合值來反映某個時間段內(nèi)的數(shù)據(jù)情況,因此時序數(shù)據(jù)庫需要提供高效的聚合函數(shù)。
批量刪除能力。時序業(yè)務(wù)對于過期的數(shù)據(jù)需要進(jìn)行批量刪除操作。
通常不需要具備事務(wù)的能力。時序數(shù)據(jù)庫與傳統(tǒng)關(guān)系型數(shù)據(jù)庫不同,傳統(tǒng)關(guān)系型數(shù)據(jù)庫注重增刪改查和事務(wù)功能,而時序數(shù)據(jù)庫針對海量數(shù)據(jù)寫入,其讀取查詢多是一段時間段內(nèi)的數(shù)據(jù)。