您好,歡迎來到易龍商務(wù)網(wǎng)!
全國(guó)咨詢熱線:13926009523

高性能時(shí)序數(shù)據(jù)庫解決方案推薦「多圖」

【廣告】

發(fā)布時(shí)間:2021-10-24 05:12  
企業(yè)視頻展播,請(qǐng)點(diǎn)擊播放
視頻作者:北京美信時(shí)代科技有限公司









BlueSky高性能時(shí)序數(shù)據(jù)庫分片方法:

哈希分片: 均衡性較好,但集群不易擴(kuò)展執(zhí)行哈希:均衡性好,集群擴(kuò)展易,但實(shí)現(xiàn)復(fù)雜范圍劃分:復(fù)雜度在于合并和分裂,全局有序分片設(shè)計(jì)

分片的會(huì)直接影響到寫入的性能,結(jié)合時(shí)序數(shù)據(jù)庫的特點(diǎn),根據(jù) metric tags 分片是比較好的方式,查詢大都是按照一個(gè)時(shí)間范圍進(jìn)行的,這樣形同的 metric tags 數(shù)據(jù)會(huì)被分配到一臺(tái)機(jī)器上連續(xù)存放,順序的磁盤讀取是很快的。

在時(shí)間范圍很長(zhǎng)的情況下,可以根據(jù)時(shí)間訪問再進(jìn)行分段,分別存儲(chǔ)到不同的機(jī)器上,這樣大范圍的數(shù)據(jù)就可以支持并發(fā)查詢,優(yōu)化查詢速度。

如下圖,行和第三行都是同樣的tag(sensor=95D8-7913;city=上海),所以分配到同樣的分片,而第五行雖然也是同樣的tag,但是根據(jù)時(shí)間范圍再分段,被分到了不同的分片。第二、四、六行屬于同樣的tag(sensor=F3CC-20F3;city=北京)也是一樣的道理。




BlueSky高性能時(shí)序數(shù)據(jù)庫誤區(qū)

時(shí)序數(shù)據(jù)庫不需要分析能力主流時(shí)序數(shù)據(jù)庫如InfluxDB、OpenTSDB,以及一些新時(shí)序數(shù)據(jù)庫例如,都只支持簡(jiǎn)單的查詢,支撐簡(jiǎn)單的場(chǎng)景,譬如單數(shù)據(jù)源單/多指標(biāo)過濾查詢、單數(shù)據(jù)源單/多指標(biāo)過濾聚集,多數(shù)據(jù)源過濾聚集等。是點(diǎn)查和聚集查詢。

然而隨著大數(shù)據(jù)分析、IoT、IIoT等快速發(fā)展,越來越多的應(yīng)用需要更強(qiáng)大的分析能力,以實(shí)現(xiàn)模式識(shí)別、趨勢(shì)預(yù)測(cè)等功能。因而時(shí)序數(shù)據(jù)需要強(qiáng)大的分析能力,包括和關(guān)系數(shù)據(jù)的關(guān)聯(lián)聚集分析和分析(如ARIMA、趨勢(shì)預(yù)測(cè)、特定模式識(shí)別、根因分析、閾值修正)等。

此外用戶希望能用自己熟悉的語言譬如Python、R等對(duì)時(shí)序數(shù)據(jù)進(jìn)行更復(fù)雜的處理,并充分發(fā)揮Python、R在數(shù)據(jù)分析方面的強(qiáng)大生態(tài)。





BlueSky時(shí)序數(shù)據(jù)庫怎么分


關(guān)系型數(shù)據(jù)庫本身比較容易成為系統(tǒng)瓶頸,單機(jī)存儲(chǔ)容量、連接數(shù)、處理能力都有限。當(dāng)單表的數(shù)據(jù)量達(dá)到1000W或100G以后,由于查詢維度較多,即使添加從庫、優(yōu)化索引,做很多操作時(shí)性能仍下降嚴(yán)重。此時(shí)就要考慮對(duì)其進(jìn)行切分了,切分的目的就在于減少數(shù)據(jù)庫的負(fù)擔(dān),縮短查詢時(shí)間。

數(shù)據(jù)庫分布式內(nèi)容無非就是數(shù)據(jù)切分(Sharding),以及切分后對(duì)數(shù)據(jù)的定位、整合。數(shù)據(jù)切分就是將數(shù)據(jù)分散存儲(chǔ)到多個(gè)數(shù)據(jù)庫中,使得單一數(shù)據(jù)庫中的數(shù)據(jù)量變小,通過擴(kuò)充主機(jī)的數(shù)量緩解單一數(shù)據(jù)庫的性能問題,從而達(dá)到提升數(shù)據(jù)庫操作性能的目的。

數(shù)據(jù)切分根據(jù)其切分類型,可以分為兩種方式:垂直(縱向)切分和水平(橫向)切分





行業(yè)推薦