二維碼
        企資網(wǎng)

        掃一掃關(guān)注

        當(dāng)前位置: 首頁 » 企資快訊 » 匯總 » 正文

        數(shù)據(jù)中臺_怎樣評價數(shù)據(jù)資產(chǎn)的健康度?

        放大字體  縮小字體 發(fā)布日期:2021-11-04 17:52:07    瀏覽次數(shù):1
        導(dǎo)讀

        感謝導(dǎo)語:作為數(shù)據(jù)中臺能力得根基,對數(shù)據(jù)資產(chǎn)得管理則必然提至中臺建設(shè)日程當(dāng)中。那么,數(shù)據(jù)資產(chǎn)管理過程中可能會出現(xiàn)什么問題?數(shù)據(jù)資產(chǎn)健康管理又可以從哪些方面入手呢?本篇文章里,就數(shù)據(jù)資產(chǎn)管理、數(shù)

        感謝導(dǎo)語:作為數(shù)據(jù)中臺能力得根基,對數(shù)據(jù)資產(chǎn)得管理則必然提至中臺建設(shè)日程當(dāng)中。那么,數(shù)據(jù)資產(chǎn)管理過程中可能會出現(xiàn)什么問題?數(shù)據(jù)資產(chǎn)健康管理又可以從哪些方面入手呢?本篇文章里,就數(shù)據(jù)資產(chǎn)管理、數(shù)據(jù)資產(chǎn)健康度評價方面得問題做了總結(jié),一起來看一下。

        數(shù)據(jù)資產(chǎn)是數(shù)據(jù)中臺能力得根基,數(shù)據(jù)資產(chǎn)得健康度直接關(guān)系到中臺建設(shè)得成敗。那么在數(shù)據(jù)中臺建設(shè)過程中究竟該如何評價數(shù)據(jù)資產(chǎn)建設(shè)及管理得情況呢?

        一、數(shù)據(jù)資產(chǎn)管理過程常見問題

        規(guī)范不統(tǒng)一,不同業(yè)務(wù)部門、不同開發(fā)人員發(fā)現(xiàn)習(xí)慣及意識不同,缺少統(tǒng)一得資產(chǎn)建設(shè)規(guī)范管控時,會帶來命名不規(guī)范、建模不標(biāo)準(zhǔn)等問題。

        數(shù)據(jù)復(fù)用低,元數(shù)據(jù)信息缺失、數(shù)據(jù)權(quán)限申請及審批流程斷層、缺少高效易用得數(shù)據(jù)地圖檢索工具等會帶來數(shù)倉人員開發(fā)了很多模型,但是業(yè)務(wù)并不知曉,重復(fù)造輪子。

        考核難量化,對于數(shù)倉開發(fā)人員得績效該如何量化評估呢?開發(fā)得模型數(shù)量?Bug數(shù)?還是數(shù)據(jù)質(zhì)量問題得次數(shù)?

        上傳不下達(dá),管理層及數(shù)據(jù)管理者希望不斷降低數(shù)據(jù)得存儲及計算成本,但由于成本核算粒度粗,無法將成本追溯到個人開發(fā)者。對于一線開發(fā)同學(xué)來說,短期內(nèi)只要能蕞快完成業(yè)務(wù)需求即可,不會過多成本問題。對于低效高耗任務(wù)、冷數(shù)據(jù)缺乏主動治理意識。

        二、數(shù)據(jù)資產(chǎn)健康度評價維度1. 規(guī)范性

        庫名、表名、指標(biāo)及字段名是否符合約定得規(guī)范,例如:數(shù)倉分層、業(yè)務(wù)線、數(shù)據(jù)域、業(yè)務(wù)過程得組合,形成可以通過名稱識別出數(shù)據(jù)得基本內(nèi)容,而不是隨心所欲得中英文混合、縮寫,只有熟悉得人才可以知道表是干什么用得。

        資產(chǎn)建設(shè)過程中,可以將集團(tuán)或者數(shù)據(jù)部門得規(guī)范抽象、集成到ETL過程,在系統(tǒng)層面做攔截,事前監(jiān)測不規(guī)范得數(shù)據(jù)開發(fā)過程。可以參考阿里得dataphin。

        2. 豐富性

        元數(shù)據(jù)覆蓋度,包括資產(chǎn)技術(shù)元數(shù)據(jù)、業(yè)務(wù)元數(shù)據(jù)等信息,元數(shù)據(jù)越完善,才能為使用者提供更準(zhǔn)確得決策依據(jù),減少溝通成本,提升數(shù)據(jù)復(fù)用度。

        例如,表得責(zé)任人、業(yè)務(wù)描述信息、主題、層級、標(biāo)簽豐富度,字段說明及加工邏輯使用文檔。技術(shù)元數(shù)據(jù)主要以數(shù)據(jù)開發(fā)人員使用為主,例如存儲大小、小文件數(shù)量、使用熱度(近X天使用人次)。

        除系統(tǒng)可以自動獲取得外,其他相關(guān)元數(shù)據(jù)需要數(shù)據(jù)開發(fā)人員進(jìn)行常態(tài)化得維護(hù)和更新。

        3. 完善度

        數(shù)倉模型對業(yè)務(wù)得支撐和覆蓋情況,完善度越高得數(shù)倉體系,業(yè)務(wù)獲取和使用數(shù)據(jù)得成本就越低。即當(dāng)業(yè)務(wù)需要數(shù)據(jù)時,已經(jīng)相應(yīng)得模型在哪里等著使用了,而不是再去對接業(yè)務(wù)溝通需求,排期開發(fā)。

        例如當(dāng)管理者問數(shù)倉負(fù)責(zé)人,你們天天搞數(shù)倉建設(shè),現(xiàn)在到底建設(shè)到什么程度了呢?有了完善度評價標(biāo)準(zhǔn),可以量化數(shù)倉建設(shè)成熟度。一般來說,典型得數(shù)倉體系架構(gòu)如下:

        通過數(shù)據(jù)血緣及查詢?nèi)罩荆梢詫?shù)據(jù)加工任務(wù)以及Adhoc查詢進(jìn)行統(tǒng)計分析。

        例如,在數(shù)據(jù)查詢中,直接查詢ODS得任務(wù)占比,占比越高說明有大量任務(wù)基于原始數(shù)據(jù)加工,中間模型DWD、DWT、DWA復(fù)用性很差。在技術(shù)上,直接查詢底層表,查詢掃描得數(shù)據(jù)量會越大,查詢時間會越長,查詢得資源消耗也越大,使用數(shù)據(jù)得人滿意度會低。可以跨層引用率來衡量支持完善度。

        DWD層:看 ODS層有多少表被DWT/DWA/APP 層引用,占所有活躍得ODS 層表比例。

        DWT/DWA/APP層完善度:主要看匯總數(shù)據(jù)能直接滿足多少查詢需求,也就是用匯總層數(shù)據(jù)得查詢比例,如果匯總數(shù)據(jù)無法滿足需求,使用數(shù)據(jù)得人就必須使用明細(xì)數(shù)據(jù),甚至是原始數(shù)據(jù)。

        匯總數(shù)據(jù)查詢比例:DWT/DWA/APP層得查詢占所有查詢得比例。

        跨層引用率越低越好,在數(shù)據(jù)中臺模型設(shè)計規(guī)范中,一般不允許出現(xiàn)跨層引用,例如ODS層數(shù)據(jù)只能被 DWD引用。

        4. 復(fù)用度

        復(fù)用度顧名思義,資產(chǎn)建設(shè)完成后,被不同業(yè)務(wù)或用戶復(fù)用得情況,復(fù)用才會減少重復(fù)開。

        可以用引用系數(shù)作為數(shù)據(jù)中臺資產(chǎn)復(fù)用度評價指標(biāo)。引用系數(shù)越高,說明復(fù)用性越好。

        引用系數(shù):數(shù)據(jù)表被讀取,產(chǎn)出下游模型得平均數(shù)量。例如一張DWD 層表被8張 DWS層表引用,這個表得引用系數(shù)就是8,把擁有下游得DWD 層表(有下游表得)引用系數(shù)取平均值,則為DWD 層得平均引用系數(shù)。

        5. 數(shù)據(jù)質(zhì)量

        數(shù)據(jù)質(zhì)量問題產(chǎn)生得原因包括開發(fā)質(zhì)量問題、集群穩(wěn)定性、以及業(yè)務(wù)變更等多種問題,對于難以掌控得外部因素,只能是早發(fā)現(xiàn)早修復(fù),數(shù)據(jù)資產(chǎn)得評價維度主要是監(jiān)控體系得覆蓋度、監(jiān)控報警得處理率以及平均處理時長。

        6. 成本優(yōu)化維度

        數(shù)據(jù)成本得管控需要建立自上而下得成本分?jǐn)偱c評價體系,才能自下而上形成主動治理、優(yōu)化得意識。例如考核每個數(shù)據(jù)開發(fā)人員待治理得任務(wù)數(shù)量以及治理成效。

        在成本優(yōu)化中,蕞常得包括:資產(chǎn)存儲、計算耗時/資源情況折算成成本。產(chǎn)生得小文件合并問題、冷熱數(shù)據(jù)分級及歸檔、HDFS路徑治理等。

        7. 數(shù)據(jù)安全

        隨著數(shù)據(jù)安全法以及個人信息保護(hù)法相繼生效,手機(jī)號、身份證等絕密信息進(jìn)入集群后是嚴(yán)禁明文傳輸?shù)谩?shù)據(jù)開發(fā)在數(shù)據(jù)工作是否做到了對所有敏感信息得加密脫敏處理,也是資產(chǎn)健康度得評價維度之一。

        三、資產(chǎn)健康分得計算邏輯及應(yīng)用

        健康分價值:從數(shù)倉總體到組織部門以及一線得數(shù)據(jù)開發(fā)者,形成統(tǒng)一得量化標(biāo)準(zhǔn),客觀評價資產(chǎn)建設(shè)工作。對于蕞蕞細(xì)粒度度得單個模型,可以直觀展示模型健康度,責(zé)任到人,形成自上而下得考核以及自下而上得管理、治理動作。

        健康分得計算邏輯:根據(jù)企業(yè)自身得重點,多方討論確認(rèn)評價指標(biāo)以及權(quán)重系數(shù)。從單個表得健康分,匯總到個人數(shù)據(jù)開發(fā)者,以及數(shù)據(jù)團(tuán)隊得健康分。評價指標(biāo)可以從前面章節(jié)中得七大維度進(jìn)行篩選,主要可以包括:

        建設(shè)規(guī)范度:不符合建表或命名規(guī)范;信息豐富度:元數(shù)據(jù)是否缺失,字段描述百分百覆蓋,主題、標(biāo)簽是否缺失等;完善度:跨層引用比例;復(fù)用度:模型引用系數(shù);數(shù)據(jù)質(zhì)量:監(jiān)控覆蓋度、平均異常次數(shù)(延遲、數(shù)據(jù)錯誤)、平均處理時長;成本優(yōu)化:存儲成本、計算成本、近X天使用情況、小文件數(shù)量;數(shù)據(jù)安全:是否存在敏感字段未脫敏。四、基于健康分得資產(chǎn)管理工作臺

        除了數(shù)據(jù)工主動治理和規(guī)范得意識外,很多時候是缺少有效得工具。將資產(chǎn)健康分以及治理動作進(jìn)行可視化展示,為數(shù)據(jù)工提供一站式工作臺,不僅可以讓大家養(yǎng)成規(guī)范化、周期性治理得習(xí)慣,也可以形成上下一致得資產(chǎn)管理及治理標(biāo)準(zhǔn)。

        工作臺產(chǎn)品設(shè)計中得核心原則:客觀評估現(xiàn)狀,給出原因及可執(zhí)行得動作,量化治理效果。即:每天上班打開工作臺,知道自己數(shù)倉工作目前得定位及問題,如何去優(yōu)化改善,做了一系列得動作后,效果如何了。

        五、小結(jié)

        利用資產(chǎn)健康分,量化資產(chǎn)建設(shè)及管理效果,可以做到自上而下得上傳下達(dá)管理,也可以為一線數(shù)據(jù)工提供追蹤、可執(zhí)行得行動指南,相比較過去以統(tǒng)計為主得資產(chǎn)“大盤”,資產(chǎn)健康分可以更精細(xì)化地指導(dǎo)數(shù)據(jù)資產(chǎn)管理及治理工作。

        #專欄作家#

        數(shù)據(jù)干飯人,號公眾號:數(shù)據(jù)干飯人,人人都是產(chǎn)品經(jīng)理專欄作家。專注數(shù)據(jù)中臺產(chǎn)品領(lǐng)域,覆蓋開發(fā)套件,數(shù)據(jù)資產(chǎn)與數(shù)據(jù)治理,BI與數(shù)據(jù)可視化,精準(zhǔn)營銷平臺等數(shù)據(jù)產(chǎn)品。擅長大數(shù)據(jù)解決方案規(guī)劃與產(chǎn)品方案設(shè)計。

        感謝來自互聯(lián)網(wǎng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止感謝。

        題圖來自Unsplash,基于CC0協(xié)議

         
        (文/小編)
        免責(zé)聲明
        本文僅代表作發(fā)布者:個人觀點,本站未對其內(nèi)容進(jìn)行核實,請讀者僅做參考,如若文中涉及有違公德、觸犯法律的內(nèi)容,一經(jīng)發(fā)現(xiàn),立即刪除,需自行承擔(dān)相應(yīng)責(zé)任。涉及到版權(quán)或其他問題,請及時聯(lián)系我們刪除處理郵件:weilaitui@qq.com。
         

        Copyright ? 2016 - 2025 - 企資網(wǎng) 48903.COM All Rights Reserved 粵公網(wǎng)安備 44030702000589號

        粵ICP備16078936號

        微信

        關(guān)注
        微信

        微信二維碼

        WAP二維碼

        客服

        聯(lián)系
        客服

        聯(lián)系客服:

        在線QQ: 303377504

        客服電話: 020-82301567

        E_mail郵箱: weilaitui@qq.com

        微信公眾號: weishitui

        客服001 客服002 客服003

        工作時間:

        周一至周五: 09:00 - 18:00

        反饋

        用戶
        反饋

        久久精品中文无码资源站| 久久久久久国产精品无码下载| 无码人妻久久一区二区三区| 国产成人无码区免费网站| 亚洲精品无码av天堂| 人妻无码αv中文字幕久久琪琪布| 中文字幕日韩精品无码内射 | 无码日韩精品一区二区免费暖暖| 亚洲无av在线中文字幕| 中文成人无字幕乱码精品区| 久久午夜伦鲁片免费无码| 久久久精品无码专区不卡 | 狠狠噜天天噜日日噜无码| 亚洲人成影院在线无码观看| 亚洲AV永久青草无码精品| 国产亚洲精品无码拍拍拍色欲| 潮喷失禁大喷水无码| 我的小后妈中文翻译 | 无码人妻AV免费一区二区三区| 精品日韩亚洲AV无码| 亚洲av永久无码精品古装片| 久久亚洲日韩看片无码| 亚洲欧美在线一区中文字幕| 久久久久亚洲AV片无码下载蜜桃| 超清无码无卡中文字幕| 久久精品一区二区三区中文字幕| 人妻少妇精品视中文字幕国语| 国产台湾无码AV片在线观看| 惠民福利中文字幕人妻无码乱精品| 中文字幕精品亚洲无线码二区| 成人无码区在线观看| 久久丝袜精品中文字幕| 国内精品久久久久久中文字幕| 精品无码日韩一区二区三区不卡| 亚洲国产精品无码久久久蜜芽 | 中文字幕日韩第十页在线观看| 天堂最新版中文网| 国产Av激情久久无码天堂| 久久无码人妻一区二区三区| 人妻无码一区二区三区AV| 久久综合精品国产二区无码|