无码专区在线男人的天堂_品国产亚洲一区二区_日韩精品一区二区二区三区_欧美亚洲综合一区色婷婷_无码少妇多水多毛在线播放_激情久久久五月天综合_国产精品青青在线观看看_网站资源多午夜一级毛片_成人羞羞视频国产网站_欧美一区二区在线视频人妻

首頁>>更多動態>>行業新聞
基于多場景計算分析的融合數倉基礎架構
來源于:zhibo 日期:2022-05-26

一、數據倉庫當前面臨的挑戰

        數據倉庫是用來存放各個業務系統數據的地方,包括網站的訪問日志、業務數據等。基于收集上來的散亂的海量的數據,以數據集成的方式進入到了數據倉庫的系統,再進行數據清洗、數據匯聚、數據加工等步驟,進而用于進行大數據分析操作。這些操作都是在數據倉庫里面來完成,最后形成集成數據集合,用于支撐各個部門的決策過程。

        

        數據倉庫是企業數字化轉型里面不可或缺的一部分,這體現在商業智能數據挖掘、數據儀表盤和數據探索這些方面。無論是企業的數據分析師,還是企業的經營決策者,都需要用它來發現商業中可能忽略的問題,實現決策的科學制定。


        當前數據倉庫的一些需求,其實基本上處理的數據是 PB 級的數據,不僅要負責 PB 級的數據的存儲,還要負責 PB 級數據的計算。因為這里計算資源和存儲資源比較多,如何通過性價比更高方式來保證數據的存儲,保證數據的計算能夠是高效的,也是很多企業關心的問題。


        要支持這種高性能的這樣的查詢,對于用戶來講,數據倉庫對外的輸出的窗口提供這樣的功能。所以在高并發聚合分析億級別的并發秒級檢索高性能的 AD hoc查詢這三方面都要給用戶提供一種高性能的體驗。


二、數據倉庫難點與解決方案

        總結起來,用戶的痛點分為三方面:多系統帶來的運維復雜;查詢性能不足;人工建倉成本高。


        針對多系統部署、成本高的痛點,信服云提供了一套的一體化智能運維系統。在這個系統里有很多的組件,例如分布式計算引擎,統一的元數據管理引擎,這些引擎在系統中是統一部署的。


        根據機器的實際的情況進行參數的調優和配置,實現一鍵安裝。運行過程中出現了問題,也可以及時地發出告警,提醒人員說當前系統可能存在問題。


       在這里面,如果是說每套系統發生掛掉的情況,通過高可用機制也能夠盡快恢復線上業務的生產,來降低因為系統故障導致的業務中斷。


        業務系統運行在這樣的數據倉庫上,就能夠保證用戶的系統是高可用的,實現智能運維,來降低運維的成本。




        針對性能不足的問題,信服云提供了一套化繁為簡的Dipper數據分析引擎,分成統一接口層和融合引擎層。可以將用戶的查詢分類,在系統中分別針對各類查詢進行優化,以獲得更優的查詢性能。


        當查詢涉及到大批量數據計算或者大批量數據分析時,可以提供Hive 或者是 Spark 這樣的分析引擎,限制內存和計算資源的使用情況,保證計算過程的穩定執行。


        當涉及聚合查詢或者明細查詢時,提供提供索引機制,在減小計算數據量的情況下,采用類似于Presto這種引擎,實現低延遲快速的計算。


        如果秒級甚至說毫幾百毫秒依舊不能滿足需求,信服云會給用戶開一個高速緩存,并采用內存計算引擎,為用戶提供更高并發、更低延遲的查詢體驗。


        融合數倉的背后有三種關鍵技術。

        第一,提供一套 ANSI SQL 接口,無需對接多種分析引擎。盡管下面用到了三個不同的組件,但是對于用戶來講,只要寫一套 ANSI SQL 的語法,就能夠獲得特定的轉換,無需用戶考慮組件的切換。


        第二,提供一套智能路由引擎,對于用戶來說,需要人工區分查詢的類型,增加了工作量。而信服云提供這套智能路由,它可以通過這種 SQL 語的分析來判斷是大批量數據的查詢、還是高性能的檢索,這個時候可以自動地選擇合適的引擎,來達到更優的性能情況。


        第三,所有的索引不需要用戶來指明說要構建什么索引,在這過程中可以通過 SQL 語句的分析來自適應地為用戶建立各種各樣的索引。




三、數據倉庫技術實踐成果

        以電子制造業場景為例,使用了信服云的數據倉庫,1萬塊圓晶芯片能夠達到秒級響應,相較于原來的幾十分鐘的分析速度,提升了用戶的檢驗效率。


        在醫療場景下,對于同一套數據存儲的明細查詢性能,清理緩存之前,可以達到并發500,即使是清理緩存以后,也能達到 200 的并發,超過用戶給百級并發秒級響應的預期。


        以 IT部門構建的數據中臺TiDB 查詢引擎場景為例,采用信服云數據倉庫后,可以實現大部分的語句的智能聚合索引,從而完成這種自動化建模,這對他們而言起到了加速效果,獲得了良好的查詢體驗。


        還有能源、水務、教育、日志分析等場景,信服云的數倉架構都提供了很好的查詢體驗,高性能的數倉組件大幅度降低了查詢的時延,能夠在千萬級事實數據下達到秒級響應的效果。

服務熱線

地址:上海市閔行區中春路8633弄73號501~502室

版權所有 ? 2015 上海致博信息科技有限公司 滬ICP備09036198號-2