【廣告】
分析過(guò)程中盡量運(yùn)用多種分析方法,以提高分析的準(zhǔn)確性和可靠性。例如,運(yùn)用定性定量相結(jié)合的分析方法對(duì)于數(shù)據(jù)進(jìn)行分析;融合交互式自助BI、數(shù)據(jù)挖掘、自然語(yǔ)言處理等多種分析方法;分析和可視化分析相結(jié)合等。數(shù)據(jù)分析過(guò)程中,要避免以下3種情況:
1)時(shí)間安排不合理。在開(kāi)始分析工作之前,一定要做一個(gè)明確的進(jìn)度計(jì)劃,時(shí)間分配的原則是:數(shù)據(jù)收集、整理及建模占70%,數(shù)據(jù)可視化展現(xiàn)及分析報(bào)告占25%,其他占5%。(數(shù)據(jù)的收集、整理和建模的過(guò)程,是反復(fù)迭代的過(guò)程)
2)數(shù)據(jù)源選擇不合理。一般企業(yè)中的數(shù)據(jù)來(lái)源有很多,SAP、TMS、CRM及各部門業(yè)務(wù)系統(tǒng),每個(gè)渠道的數(shù)據(jù)各有特點(diǎn)。這時(shí),應(yīng)該慎重考慮從哪個(gè)渠道獲取數(shù)據(jù)更加快捷有效。數(shù)據(jù)源選擇不合理,不僅影響結(jié)論的可靠性,而且有返工的風(fēng)險(xiǎn)。
3)溝通不充分。無(wú)論是分析人員內(nèi)部的溝通還是與外部相關(guān)人員的溝通,都是至關(guān)重要的。與外部人員溝通效不順暢,可能造成前期需求不清,中間業(yè)務(wù)邏輯混亂,終導(dǎo)致數(shù)據(jù)分析結(jié)果不好。但讀寫分離和分庫(kù)分表帶來(lái)了應(yīng)用層面的復(fù)雜性,應(yīng)用程序需要在設(shè)計(jì)開(kāi)發(fā)階段就考慮到數(shù)據(jù)的拆分。與內(nèi)部人員溝通效率低,可能造成分析進(jìn)度滯后,分析工作開(kāi)展不暢等諸多問(wèn)題,直接影響分析效果。
數(shù)據(jù)分析技術(shù)面臨的挑戰(zhàn)是什么呢?
在日新月異且喜新厭舊的技術(shù)時(shí)代,企業(yè)已經(jīng)認(rèn)識(shí)到“數(shù)據(jù)開(kāi)始慢慢變成為了新的 ”金子“ 或者 ”石油“,那么企業(yè)在數(shù)字化轉(zhuǎn)型的浪潮中,如何通過(guò)大數(shù)據(jù)、云計(jì)算等先進(jìn)的技術(shù)保駕護(hù)航?數(shù)據(jù)分析報(bào)告包含環(huán)境評(píng)價(jià)、國(guó)民經(jīng)濟(jì)評(píng)價(jià)、財(cái)務(wù)評(píng)價(jià)、社會(huì)效益評(píng)價(jià)四大體系,深受國(guó)內(nèi)外企業(yè)及政府機(jī)構(gòu)的信賴。企業(yè)數(shù)據(jù)量從GB級(jí)增長(zhǎng)到TB級(jí),應(yīng)用如何平滑演進(jìn)?從數(shù)據(jù)倉(cāng)庫(kù),到數(shù)據(jù)湖、數(shù)據(jù)共享平臺(tái),企業(yè)如何利用數(shù)字資產(chǎn)?這些都是企業(yè)在數(shù)字化轉(zhuǎn)型過(guò)程中面臨的問(wèn)題。
項(xiàng)目數(shù)據(jù)分析。Hadoop系統(tǒng)和NoSQL數(shù)據(jù)庫(kù)已經(jīng)成為管理大數(shù)據(jù)環(huán)境的重要工具。不過(guò),在很多情況下,企業(yè)利用他們現(xiàn)有的數(shù)據(jù)倉(cāng)庫(kù)設(shè)施,或是一個(gè)新老混合的技術(shù)來(lái)對(duì)大數(shù)據(jù)流入他們的系統(tǒng)進(jìn)行管理。
無(wú)論一個(gè)公司部署什么類型的大數(shù)據(jù)技術(shù)棧,有一些共通的因素必須加以考量,以保證為大數(shù)據(jù)分析工作提供一個(gè)有效的框架。在開(kāi)始一個(gè)大數(shù)據(jù)項(xiàng)目之前,去審視項(xiàng)目所要承擔(dān)的新數(shù)據(jù)需求的更大圖景顯得尤為關(guān)鍵。
數(shù)據(jù)分析方法
我們?cè)谑袌?chǎng)調(diào)查數(shù)據(jù)分析中常用的統(tǒng)計(jì)分析方法包括:描述性統(tǒng)計(jì)、回歸分析、相關(guān)分析法等。描述性統(tǒng)計(jì)分析就是對(duì)一組數(shù)據(jù)的各種特征進(jìn)行分析,以便于描述測(cè)量樣本的各種特征及其所代表的總體的特征。一個(gè)很好地例子就是:一家公司開(kāi)發(fā)了一個(gè)數(shù)據(jù)倉(cāng)庫(kù)用來(lái)維護(hù)從能源使用計(jì)收集到的數(shù)據(jù)。在數(shù)據(jù)分析中,常用的描述性統(tǒng)計(jì)分析包括集中趨勢(shì)分析、頻數(shù)分析、數(shù)據(jù)的分布、數(shù)據(jù)離散程度分析等等。回歸分析法是從事物及其過(guò)程變化的因果聯(lián)系出發(fā),對(duì)事物未來(lái)發(fā)展趨勢(shì)進(jìn)行預(yù)測(cè)的一種統(tǒng)計(jì)方法,可以確定兩種或兩種以上變數(shù)間相互依賴的定量關(guān)系。相關(guān)分析法是研究隨機(jī)變量之間相互關(guān)系規(guī)律性的一種統(tǒng)計(jì)方法。