如何找到数据主人(中)——数据认责:权益跟义务
上期,我们聊了一些关于数据主人的入门性知识作为言引,主要是介绍了一个企业到底要不要找数据主人,对其中的概念关于数据主人的四大金刚方面信息做了讲解。
今天,在这一期里,我们继续在接着上期的话题来展开拓展讲解数据与主人之间关系的那些事儿,再聊一聊关于数据治理过程当中的怎么找主人的事情。
本期,我们主要是从企业业务数据认责的角度,来介绍怎么找数据的主人研究课题。于大家一起共勉!
引言
在开始介绍怎么找的问题前,先请大家看一句世界名人曾经说过的一句经典话,“There are a thousand Hamlets in a thousand people's eyes.”,这句话是莎士比亚说的,表达的意思是:“一千个观众眼中有一千个哈姆雷特。”即仁者见仁,智者见智。说每个人都会对作品有不同的理解,每个人对待任何事物都有自己的看法,同样的,一千个人就有可能有一千种不同的看法。
由此作为篇引,数据与主人之间到底存在什么样的关系,数据需不需要进行权益的认责,主人对数据该不该负有一定管理应尽的义务。当然,数据是一定存在着某种归口部门或组织人员归属的属性,每一个部门的人他们眼中的数据有着不同的理解,因为组织是有层级的金字塔结构构成的,那么组织中的主人同样存在着不同的理解,即以DIKW模型中很好的体现出来。
图1:DIKW模型
数据只有在所属的主人那里才把他变为想要的信息,在往上一层总结出他要的知识,最后形成主人对企业发展挖掘新的营利增长点的智慧,作为决策支撑。所以说数据只有在主人那里才能发挥数据的价值,在数字化转型中掌握先机,赢得企业业务在社会中的大发展机遇。
怎么找数据主人
接下来,我们开始走入中期的题目。在找数据的主人之前,会有同学们发问了:“找不着怎么办?”等一系列的问题。接下来我主要以咨询思维为大家把找数据主人的这片儿乌云一步一步的为大家给剥开,让大家沿着我的视野与知识高度来了解数据的主人到底是谁?他在哪儿?是如何识别出来的。
其实,在每一个企业中有着各种各样的不同种类的数据,首先要知道并了解企业中都有哪些数据,如果都不知道自己企业中有哪些类的数据,那么要找数据的主人,或者是找不着那也就是自然而然的事情了。大家想一想,哪些类型的数据都不清,我问大家一个问题:“不清楚有哪些种类的数据,那你如何找数据的主人?”这是一个无解的。即知其然并知其所以然。
大家不妨仔细想想,主人都与哪种的数据有关系?数据与主人之间有那种权责或认责?带着这些问题我们为大家进行逐一分解找不着怎么办的问题。
首先,我们要对企业中单独数据有哪些种类弄清楚,如下图所示:
图2:三种对企业最有价值的数据
上图中,不难看出每个企业的数据主要集中在在三大种类,这三种对企业最有价值的数据。那么他所对应的也是有主人的,数据对其对应的主人是有一定权益和义务的,因为数据是通过某组织或组织人员的应用才发挥出数据的价值。
那么,要想找到数据主人就得对数据进行确权、认责的一个过程,这样才能很好的找主人。既然找主人,就首先明确落实全公司性数据责任体系,对数据治理工作开展的过程中起到推动和开展至关重要。在数据治理中的数据标准化建设中,明确和落实数据的业务及系统责任方,具体来说,数据认责,即明确数据业务主管方,和归口部门,以及数据的各协同方。需要各方协同,并互相达成统一共识性的认识的觉悟,这是数据认责的基石。
要想知道谁对数据负责,他的数据权益是什么?就得知道以下几个关键性问题:
Q1. 什么是数据认责?
Q2. 为什么要认责?
Q3. 认什么责?
Q4. 怎么认责?
从这几个问题中我们来探秘与寻找“数据主人”的答案。我们先从数据认责说起数据主人的探讨话题。
Q1: 什么是数据认责?
“数据认责”一词的来源是源自于DAMA DMBOK2《DAMA数据管理知识体系指南》中有关数据管理专员(Data Steward)以及数据管理专员责任制(Data Stewardship)的相关内容,是指为企业数据资产管理而分配、委托的业务职责和正式的认责。
概括成一句话就是“构建并管理人与数据之间的关系”。说得直白一点,就是在企业着手建立数据治理体系、开展数据资产管理时,对于相关数据管理权力和责任所进行的分配,以此使各相关方明确自身在数据管理活动中应当做什么以及由于这些活动所需要承担的责任,就是得借助数据治理体系的手段进行责权利的确权,把数据主人的权益进行确认化固化下来。
数据认责属于制定“游戏规则”的范畴,就是先制定数据与主人的游戏归属规则,被认为是数据治理的一项十分重要的基础性工作而受到广泛的关注。
但也往往是最难以推行下去的关键点。主要还是在于企业各级领导及执行者他们没有形成数据文化的氛围,认识不够深入,浮于表面现象。
Q2:为什么要认责?
做数据认责,本章节一开始提到的先把数据种类弄清楚:
第一点是解决数据问题,在明确了人与数据之间的问题之后我们可以快速定位数据问题的负责人,通过责任关系,提升解决数据的效率;
第二点是在做数据分析的时候要找到对应的资产,找到对应的数据,利用数据来做分析。
通过数据认责,我们可以明确数据资产审核路径,快速获取分析所需要使用的数据。
数据认责是要对企业范围内各相关方的数据管理职责进行分配,从而明确彼此间的工作边界以及协作机制,这是企业构建稳定而规范的数据治理体系的重要基础。责任和边界不清,往往容易造成多头管理或者“三不管”的情况产生,也会直接影响相关数据管理工作的效率。
国内,企业中大多数存在是部门壁垒犄角的现状,多头林立拉山头管理的现象比比皆是,这充其量算是一个聚会而已。不算是一个企业的整体团队,也就则然而然的形成不了合力。这就犹如龙舟比赛,龙舟上的20几个队员,谁也不容忽视,稍有松懈就会垮下来的。就是这个道理。
由于企业中数据管理通常发端于信息化,例如数据需求、数据质量、数据安全等通常作为企业信息系统建设和运维工作的一项内容或子项,因此当迈入数据时代,数据管理的相关职责也就自然而然由信息部门一肩承担。而信息部门很快就会感觉“带不动”,举步维艰。例如,“数据含义是什么”、“什么是好数据”、“谁可以使用数据”、“数据要存多久”等问题都没有办法十分肯定地回答。这实际上是能力与责任的不平衡,需要在相关参与者中对数据管理职责进行重新认定和分配。
此外,从管理的角度,数据认责是要建立企业数据管理的责任制,是企业机制的一个重要组成部分,是在数据管理领域的延伸,目的是要促进执行力的提升。
Q3:认什么责?
每一个环节有每一个环节的作用和功能,数据管理应当覆盖数据生存周期的每一个环节,数据责任同样对应存在于每一项数据管理和应用活动之中,由企业内的数据资产所有者、业务认责方、操作认责方以及技术认责方等角色分担。
数据资产所有者:主要负责制定数据管理政策,维护数据资产目录并分配数据认责权限;
业务认责方:主要负责明确数据定义,制定数据标准、质量规则、安全规则并监控相关数据问题,同时也是对应数据的责任主体;
操作认责方:主要负责执行数据管理规则,录入各项数据并解决相关数据问题;
技术认责方:主要负责为数据管理提供技术支持,推动数据架构、标准和规则等内容的落地。
数据作为资产,所有者通常由企业数据管理委员会或管理部门代行;技术认责方通常由信息技术部门承担;业务认责方对应各块数据的业务管理部门;操作认责方则主要是基层业务单位。由于作为技术认责方的信息技术部门常年开展信息化建设和运维工作,对于其相关数据责任也较为明确,因此,作为业务认责方的业务管理部门以及作为操作认责方的基层业务单位通常在实践中将成为数据认责机制建立的优先领域和工作重点,并具体落实数据主责、录入、审核以及质量改进等责任。
Q4:怎么认责?
数据认责首先是梳理认责的数据项,即对哪些数据进行认责管理。
企业的数据资产中通常包含成千上万的数据项,对于认责来说这是一个巨大的数量,也意味着巨大的工作量,因此不可能一蹴而就,需要分批次地逐步去完成。同时,企业从效用的角度出发,通常会对数据认责的实施抱以价值期望。
数据认责讲究策略,可以采用优先级的策略对企业中所属业务流程,或业务场景的重要性按照优先级的轻重缓急来排一个从上至下由高到低的顺序来依次梳理,这样比较有条理性也不至于手忙脚乱的现象。最重要的还是要结合每家企业自身的业务与企业管理制度相结合的思路去开展数据认责工作稳步持续进行。
因此,在认责数据项的梳理和筛选上可以采用“问题+价值”双驱动的策略,即优先对问题多发且业务价值(影响)较大的数据项开展认责管理,通过责任落实改善和提升数据质量,从而控制和解决问题,支撑业务发挥价值。为此,企业可建立一套数据问题的归集、分析和管控机制,以及高业务价值核心数据项的识别方法。
其次是梳理认责关系矩阵 ,即数据各项责任与组织机构、岗位、人员之间的对应关系。而后,将相关数据责任落实到对应岗位人员的日常工作和数据操作中。数据责任的落实通常可以与数据质量整治工作结合进行,在明确岗位人员数据责任的同时,同步明确责任落实要求,例如数据录入责任与数据项录入规范的同步执行,通过规范录入行为以及纠正录入错误强化责任意识。
企业在实施数据认责管理时,可以采用自上而下的传统建制模式或者自下而上的敏捷模式:建制模式是首先进行数据认责管理机制的顶层设计,而后进行落地实施。实施过程主要是通过制度机制的宣贯培训以及小范围试点,按既定的认责数据项清单在企业范围推行认责管理。
敏捷模式则是针对数个业务价值明确的数据项,或者直接针对一个突出的数据问题,在一个很小的组织范围(通常就是数据问题的多发地)开展认责管理,目标就是快速、有效地解决问题,而后再逐步形成可推广的机制设计。此种模式存在一个缺点是,不能从企业整体数据战略上进行整体规划,往往只是某一个体领域,无法从全局上统揽整个企业业务数据的大视野,即也无法形成大的格局。
开展数据认责工作一般有两种方式,一种是通过咨询的方式来做数据认责;一种是通过数据认责工具的方式来承载数据认责咨询的方法论,基于认责工具高效的管理认责过程,实现数据认责的工作落地。
数据认责首要的是要对自己企业内有哪些数据?他们都在哪里?这些数据的状况是怎么样的?对此有一定掌握的前提之下。然后再进行数据认责,我们可以缩短数据问题追责周期的窗口期,这一定是成反比的。
综上所述,通过前面的一连几个连续性发问,我们有何体会。是否我们对数据和主人是否有了更清晰的认识到更深入层次的了解呢,还是不了解不过没有也没关系,这是需要经历一个过程期才能逐步地形成统一认识。
所以说,数据与主人我们要用辩证的方法去对待,当数据与主人之间有了共识,自然会水到渠成的达成我们想要的成果。可以这么说,数据与主人是既爱又恨的这么一对相互牵制的角色。但又互相不能剥离开来的看问题。
找不着的根因
通过上一节从咨询角度所剖析,数据找不着的根因逐渐地有了一些清晰的认识。那么,同时又会面临着一个棘手的问题:“找不着怎么办呢?” 这也是不可回避的问题。
确实,有了找主人的一点点思路后,又被这一个棘手问题给打回去原点了。
寻找数据的主人是每个企业所共同面临的一个不可回避的棘手问题,但往往又是很困难重重的一件难以推动下去的事情。从以往的咨询经验来看,每个企业的数据主人都很难找到,确切的来说不是找不到的问题,原因是多方面的。
主要从两个角度为大家剖析根因:
从绩效的角度讲,它会涉及到每个数据主人的切身数据权益与责任问题,这时数据它是有主人的,此时的数据与主人之间产生了某种利益相挂钩;
当某一业务场景下的数据出现了数据质量问题时,这时有质量问题的数据就成了无主人的尴尬境遇,因为这是有问题的数据就与主人成了脱钩的现象,在此情况下是很难找到主人的。
大家思考过关键性问题吗?数据与主人之间需要一个组织或部门进行推动指导的动力。我们往往忽视了这个关键性的基点。但是企业中部门与部门间是有一堵墙横亘在中间,有时部门的领导明明知道但是就有无法可控的执行力去推动。也有时是企业的领导很强势,但部门难以形成一股绳,往往也执行不了。所以找数据主人是一个统筹全局观念的觉悟,只有大家的觉悟提高了,水到渠成自然就能找到数据对应的主人。根因在于观念的提升与改观。
好了今天就说道这里,后续在继续探讨此话题。
写在最后的话:
- 重磅发布《数据模型管理能力成熟度白皮书》 基于国内各企业数据模型管理的现状调研及数据分析,我们发现企业架构办和数据建模相关部门、数据模型开源社区实践者的数据模型设计及管理工作流程中存在下述问题:企业在进行数据模型的设计及数据模型的管理中,在逐渐加强企业内部的数据治理工作时,虽然意识到数据模型管理的重要性,也在努力加强数据模型管理的工作,但是
- Datablau与多家企业完成信创产品兼容性认证 ——中间件系列 近日,北京数语科技有限公司成功与北京东方通科技股份有限公司(简称“东方通”)、北京宝兰德软件股份有限公司、山东中创软件商用中间件股份有限公司(简称“中创中间件”)、深圳市金蝶天燕云计算股份有限公司(简称“金蝶天燕”)等生态合作伙伴,经过严格的联合测试,完成了产品兼容认证。北京数语科技有限公司致
- 北京数语科技有限公司获得阿里云产品集成认证 近日,北京数语科技有限公司Datablau数据治理平台与阿里云计算有限公司(以下简称“阿里云”) 经过严格测试程序完成产品集成认证测试,主要产品为云原生关系型数据库PolarDB、云原生数据仓库AnalyticDB。(证书1: 云原生关系型数据库PolarDB)(证书2: 云原生数据仓库AnalyticDB)阿里云的产品生态集成认证是面向阿里云合作
- 如何找到数据主人(下)---数据认责:权益跟义务 在前面中期,聊了一些据主人怎么找以及找不着怎么办的内容。在这最后一期里,我们继续接着中期的话题来介绍找着了怎么处理的问题。希望与大家一起共勉!引言数据主人或数据权益归属找着了,接下来该怎么处理数据的归属管辖权,用什么样的机制进行常态化的持续下去,采取哪种抓手方式进行,这个末期是我们今天要讨论的话题。
- 如何找到数据主人(中)——数据认责:权益跟义务 上期,我们聊了一些关于数据主人的入门性知识作为言引,主要是介绍了一个企业到底要不要找数据主人,对其中的概念关于数据主人的四大金刚方面信息做了讲解。今天,在这一期里,我们继续在接着上期的话题来展开拓展讲解数据与主人之间关系的那些事儿,再聊一聊关于数据治理过程当中的怎么找主人的事情。本期,我们主要是从企