【廣告】
時序數(shù)據(jù)庫介紹
工業(yè)互聯(lián)網(wǎng)作為新基建的重要組成部分,迎來了快速發(fā)展期。如今,在電力、制造、采掘等眾多行業(yè),工業(yè)互聯(lián)網(wǎng)正在落地,催生了眾多新的場景和業(yè)態(tài)。工業(yè)互聯(lián)網(wǎng)通過智能機器間的連接并將人機連接,結(jié)合軟件和大數(shù)據(jù)分析,重構(gòu)工業(yè)、激發(fā)生產(chǎn)力。這一切的背后,都離不開一個詞:工業(yè)數(shù)據(jù)。
對工業(yè)互聯(lián)網(wǎng)領域來說,一個非常明顯的特點就是匯聚了海量的工業(yè)數(shù)據(jù),只要機器開動,數(shù)據(jù)就無時無刻不在產(chǎn)生,這些數(shù)據(jù)蘊含了巨大的價值,具有巨大的可挖掘性。同時,工業(yè)數(shù)據(jù)的一個非常明顯的特點就是和時間有關。
為什么要建立一個時間序列數(shù)據(jù)平臺?
減輕開發(fā)人員的工作
我們經(jīng)常會看到開發(fā)人員不斷編寫代碼來解決相同的問題,如果我們將其引入到平臺或者是數(shù)據(jù)庫中,開發(fā)人員的代碼量就會減少,解決問題的時間就會被優(yōu)化。
時間是特殊的
除了可用性目標之外,我們還可以圍繞時間序列的特性進行一些數(shù)據(jù)庫的優(yōu)化,例如,在插入時聚合和縮小樣本,在用戶想要釋放空間時自動排除高精度數(shù)據(jù)。甚至還可以構(gòu)建針對時間序列數(shù)據(jù)進行優(yōu)化的壓縮。
超越數(shù)據(jù)庫,使開發(fā)更容易
專為時序數(shù)據(jù)構(gòu)建數(shù)據(jù)庫的一個優(yōu)點就是它可以超越數(shù)據(jù)庫。我們發(fā)現(xiàn)大多數(shù)用戶遇到了一系列需要解決的問題,如何收集數(shù)據(jù),如何存儲數(shù)據(jù),如何處理和監(jiān)視數(shù)據(jù),以及如何可視化。
使用通用API可以使社區(qū)更容易的構(gòu)建解決方案。用 line protocol來表示時間序列數(shù)據(jù),用于寫入和查詢的HTTP API,以及用于處理的Kapacitor……隨著時間的推移,我們可以對常見的用例來預先構(gòu)建組件。
時序數(shù)據(jù)的概念
經(jīng)濟計量學獨用名詞。
例如:某省從1940年至1999年各個年末的人口數(shù)是由50個時點數(shù)組成的時序數(shù)列,而各年的糧食產(chǎn)量數(shù)則是由時期數(shù)組成的時序數(shù)據(jù)列。時點數(shù)據(jù)列中的每一個數(shù)必須是同范圍、同一時點上的統(tǒng)計數(shù)據(jù);時序數(shù)據(jù)列中的每一個數(shù)也必須是同范圍的、同一時期長度上的統(tǒng)計數(shù)據(jù)。上述兩例中,人口數(shù)據(jù)列必須是同一范圍內(nèi)、行政區(qū)劃不變動(如有變動應當調(diào)整),在各年同一時刻的人口數(shù);糧食產(chǎn)量數(shù)據(jù)列必須是在同一范圍內(nèi),每年按照相同的統(tǒng)計口徑和計算方法得到的糧食產(chǎn)量數(shù)量數(shù)。如果行政區(qū)劃,統(tǒng)計口徑或計算方法變化了,在使用時都必須經(jīng)過調(diào)整處理。如果是價值量數(shù)據(jù),數(shù)據(jù)列中的各個數(shù)據(jù)的計價標準要求是可比的,也要進行調(diào)整處理。
時序數(shù)據(jù)的目的介紹
時間序列分析的目的是通過找出樣本內(nèi)時間序列的統(tǒng)計特性和發(fā)展規(guī)律性,構(gòu)建時間序列模型,進行樣本外預測。在建立模型時要求時間序列是平穩(wěn)的,但實際進行分析的時間序列尤其是來自經(jīng)濟領域的時間序列大多是非平穩(wěn)的。這些非平穩(wěn)的時間序列往往具有某些典型的數(shù)據(jù)特征。在建立模型時,往往根據(jù)序列表現(xiàn)出的數(shù)據(jù)特征考慮合適的時間序列模型。