越来越多的企业建设大数据平台。理解存量业务数据库是大数据平台建设成败的关键。常常有大数据平台建设到一半又返回来做数据治理。因为存量数据的业务定义普遍缺失,通过数据治理将全量数据进行系统化梳理,后面的大数据平台建设及数据分析才能顺畅推进。

解决方案
元数据管理

随着接入业务需求的增多,大数据平台内的数据衍生会非常的频繁,一个统一和自动的元数据管理是非常必要的。Datablau DAM可以全自动的采集各种数据库和数据对象,同时为新增数据制定变更时间和版本,监控数据与基线模型的差异,并通知到系统负责人。

大数据平台通过ETL导入业务数据库的数据。两者的强偶合导致大数据平台对业务数据库的变更非常敏感、强依赖。常常业务系统一升级,就会影响大数据平台的正常工作。相关人员紧急“救火”,日常工作痛苦不堪。 Datablau数据变更影响分析功能自动抽取ETL的数据血缘,建立数据间的关系,自动发现数据间的变更影响。

数据整合模型

整合模型实际是数据中台的核心内容,整合模型通过对业务的理解,以业务对象为核心,构建企业数据统一视图。整合模型不是一蹴而就,找到能够统筹所有业务的模型专家是不现实的。因此Datablau的理念是通过一个统一的模型构建平台,每个业务口的专家管理自己的模型,最终通过一个协作整合的过程,构建出自己的数据中台模型,解决中台构建普遍的人才稀缺和成本巨大的难题。

Datablau DDM就是为了这个需求而生,帮助模型师理解存量数据,通过协作方式构建模型的逻辑中台。

指标体系

大数据平台的重点任务是输出企业的分析结果,为了保证结果的准确性和一致性,指标体系的定义非常重要,通过Datablau DAM模块可以统一管理企业的指标,保证分析前台的口径一致,同时分析可以逆向追朔其加工过程,帮助分析人员解决指标的加工路径和质量问题

数据质量监控

数据质量管控是大数据应用的重要保障,通过DAM的数据质量模块,可以根据数据标准和业务质量规则,对数据进行自动核标和质量检查,提供数据质量的追朔和管理。

目标成效
Datablau的大数据治理提供了数据加工,监控和共享访问的全生命周期的管理,保障大数据平台的数据从产生,加工到消费的全过程,确保数据可理解,质量可靠,方便使用。同时DAM也是一个生态型的数据治理平台,使应用开发人员,数据开发人员,数据治理人员和业务数据消费人员协同在同一个平台上,共同提供数据的全息影像,解决数据的加工链离散化,数据信息散落导致的业务信息缺失的关键问题,是企业级的全过程数据管控的最佳选择。